-
Notifications
You must be signed in to change notification settings - Fork 6
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
mendexのデフォルト文字コードのUTF-8化 #60
Comments
ことから考えると,「Windows のデフォルト入出力を Shift-JIS から UTF-8 に変える」だけでも十分な気もします。ざっと思いつくことを書いてみます。
|
今回の変更で「森鷗外」のようなJIS第1,2水準でカバー出来ない例がデフォルトで使えるようになります。入出力コードの変更だけでは、それは実現できません。
五十音順で決定できる項目の順序は全く変わりません。
mendex は「英語+日本語」のみ。
これは同意します。 |
手元の「改訂第7版 LeTeX2ε 美文書作成入門」の索引を眺めてみたら、 |
これは,「pTeX の内部コードは将来もずっと UTF-8 にはしない」という命題と同じだと思っています。pTeX が内部 UTF-8 化する時が仮に来ないのであれば,mendex だけ内部 UTF-8 デフォルトになってもあまり問題解決にはならない気がする点を気にしています。
この二件については少し理解しました。 |
誤解のないように書いておくと,私としては特に「mendex のデフォルト内部 UTF-8 化」に反対はしませんが,積極的賛成するほどの理由は持っていないところです。 |
うーん。今ひとつピンとこないです。pLaTeXの範囲でも有意義なケースは考えられます。 \documentclass[autodetect-engine]{jsarticle}
\usepackage[multi]{otf}
\input{otf-hangul.dfu}
\usepackage{makeidx}
\makeindex
\begin{document}
서울\index{ソウル@서울}
\printindex
\end{document} 以下、雑談モードです。 |
なるほど,pLaTeX でも確かにそういう例は書けますね。
以下の二件の事実があります。
一件目から,「pLaTeX 自体をなくす」「pLaTeX を unsupported / obsolete にする」はまだまだ先のような気がします。さらに,二件目から「platex を uplatex のシンボリックリンクにする」もどこに影響が出るかわからないので,調べた方が良いでしょう。pTeX 系をずっとサポートするのは手間ですが,現状見捨てることはできないので苦しんでいます。どちらかというと, #32 を決着させる方が先でしょうね…。 さらに私個人の意見ですが, 「pLaTeX の挙動を凍結し,何も改善・変更しない。ただ,LaTeX や babel など upstream の変更が pLaTeX を致命的に壊す可能性は残るので,upstream を監視しつづけて,壊れた時だけ pLaTeX を直す」 というメンテナンスは面白味がなくツマラナイと思っています。労力の心配よりも,「どうせメンテナンスするなら,改善あり・変更ありで底上げしていく」という方が,私はモチベーションが上がります。 |
これは初めて知りました。私の予想よりupLaTeXが善戦しています!!
それが、p(La)TeX→up(La)TeX を両方サポートする場合の実装コストだったりp(La)TeX→up(La)TeXの移行コストになるのは分かります。
私もそこまでは想定できて/していません。
と分けると「共通部分」が莫大で、「固有部分」は小さいのではないかと思います。(いつも有り難うございます)
モチベーションは本当に大事だと思います。 ところで、
現状は "version 2.6f [14-Aug-2009]" と日付入りでした。 |
LaTeXの利用者のコンピュータスキルのレベルはPerlやRuby,Pythonなどよりも平均的に低いと思うので,こういう比較は危険な気がします.とはいえ,差が非常に小さいという事実は正しいと思うので,
は同感ですが. |
皆様、コメント、ご協力ありがとうございました。 |
Windowsでp(La)TeX等の入出力のデフォルト文字コードがUTF-8になったのに刺激を受け
mendex のデフォルト文字コードを変更しようかと考えています。
mendexのUTF-8対応の状況は、フォーラムの2014年頃の議論
MakeIndex, Mendex, XindyとMendexのUnicode化の通りです。
mendexの場合、インデックスは「表記」「読み」で管理されています。
読みは常にEUC-JPで扱われます。
表記はアスキー社のオリジナル版はEUC-JP限定でした。2014年の拡張でUTF-8に切り替えられるようになり、表記にJIS第1,2水準の縛りが無くなりました。
mendexの内部コードとは、表記の文字コードを指します。
入出力の文字コードは ptexenc により、Shift_JIS, EUC-JP, JIS(ISO-2022-JP), UTF-8が利用可能になっています。
TeX Live 2018の現状は、ソースを眺めた限り、以下のようになっているようです。
Windows:
PTEX_KANJI_ENC
指定あり: 入出力コードを変更-U
オプション: 入出力:UTF-8, 内部:UTF-8 両方変更-E
,-J
,-S
オプション: 入出力コードを変更-I euc
,-I utf8
: 内部コードを変更Unix系:
PTEX_KANJI_ENC
指定あり: 入出力コードを変更-U
オプション: 入出力:UTF-8, 内部:UTF-8 両方変更-E
,-J
,-S
オプション: 入出力コードを変更-I euc
,-I utf8
: 内部コードを変更それを以下のように変更しようと考えています。
Windows, Unix系共通:
PTEX_KANJI_ENC
指定あり: 入出力コードを変更-E
,-J
,-S
,-U
オプション: 入出力コードを変更-I euc
,-I utf8
: 内部コードを変更デフォルトの内部コードの変更に伴い、同音異義語の順番が入れ替わる場合が発生するなど、僅かな影響は予想されます。
アスキー社さんのオリジナルのmendexの動作を変更することになりますが、許容されると考えています。
-I euc
を利用すれば従来通り動作することご意見があればお願いします。
The text was updated successfully, but these errors were encountered: