用語集のメンテナンスについて

昨日Multitermの最適化を行ったところ、28日と同様のエラーが出ました。翻訳メモリの方は最適化をした方がよいようですが、用語集は最適化は使わない方がよいと判断しました。メンテナンスはエクセルベースで行うことにします。ただし、エクセルベースのメンテナンスにも注意が必要です。要点だけかいつまんで書くと、

 

 

  • エクセルのおせっかいで、ハイフンから始まるものは関数に変換されて数字に変わってしまう
  • 特殊文字は”?”になってしまう(これは、むしろ、テキストに吐き出すときにおこるようです)

対策としては

  • テキストをエクセルで開く際に、チャンクの列は文字列として認識させる
  • そもそも登録するときに特殊文字は登録しない(翻訳メモリは特殊文字も認識するようです)
  • 化けてしまった部分は連続数字羅列か”?”になっているので、検索機能で探して修正する(なお、エクセル上でワイルドカードとしてではなく、純粋に文字として”?”を検索したい場合はチルダ”~”を”?”の直前につけます。)

最近は、対訳を取る前に、unicodeでエンコードできない文字は、すべて修正してから登録するようにしています。一例を挙げるとÜ⇒Ue、Å⇒Aa 、≧⇒=>などです。

スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です