**文書の過去の版を表示しています。**
Steps for Adding Chinese name into [*.input files]
Run bash readSPname.sh
to read File spname.txt line by line, nameSearchingWithSinicaDB.js
to match the Chinese name with the scientific name.
Then we can get spnameSinica.txt
, which contains Chinese names used in China Mainland and scientific names and looks like “中文名:scientific name”.
Copy and paste the content into the traditional and simplified conversion tool, which can convert most of the traditional characters into simplified characters.
Note:
a. The book, Latin-Chinese Dictionary of Fish Name by Classification System, was jointly published in Taiwan by Shanghai Ocean University and Academia Sinica,
Therefore, the characters used are traditional Chinese characters.
b. The trouble is that some Chinese characters were not digitized a decade ago, so this database uses images directly for display. The Chinese names obtained will be partially missing in this case.
In addition, some Chinese characters were not displayed correctly on the web page, so the obtained Chinese characters are also mojibake. I think this can only be fixed by manual visual inspection.
c. Traditional and simplified conversion tools can be easily found on the Internet, for example: https://www.aies.cn/
But fish names occasionally use rarely-used Chinese characters. So conversion tools are not foolproof. There are some Chinese characters that need to be converted manually, too.
Run bash readInputFile.sh
to read input files
file by file and line by line.
createFiles.js
will prepare a dictionary array based on spnameSinica.txt
we get before.
Every line in *.input files
will be searched with the dictionary. Then the results will be printed into corresponding files.
Steps for Adding Chinese name into [classifylist.txt file]
Run node classifylistAddChinese.js > classifylist_zh.txt
,
classifylist_plain.txt
will be split into an array, then searched with the dictionary based on spnameSinica.txt
.
日本語訳は参考までに
[inputファイル]に中国語名追加手順
1.bash readSPname.sh
で spname.txt
を一行ずつ読み、nameSearchingWithSinicaDB.js
で中国語名と学名とをマッチングさせる。
すると、中国本土で使われている中国語名と学名が含まれ、「中国語名:scientific name」のように見える spnameSinica.txt
を取得することができる。
この内容をコピーして、繁体字・簡体字変換ツールに貼り付けると、ほとんどの繁体字を簡体字に変換できる。
注意
a.「拉漢世界魚類系統名典」は、上海海洋大学と中央研究院の共同出版により台湾で発行されたものであるため、使用されている文字は繁体字である。
b. 厄介なことは、10年以上前にデジタル化されていない漢字があるため、このデータベースでは画像を使って表示している。この場合、得られた中国語名は一部欠落する。
また、Webページで正しく表示されていない漢字もあり、取得した中国語名も一部モジバケになってしまう。
手作業による目視検査でしか直らないと思う。
c. 繁体字・簡体字の変換ツールは、インターネット上で簡単に見つけられる。
例えばhttps://www.aies.cn/
しかし、中国語名には、日常あまり使われてない漢字が使われていることがあるため、変換ツールは確実ではない。手動で変換しなければならない漢字もある。
2.bash readInputFile.sh
を実行して、input files
を1ファイルずつ、1行ずつ読み込ませる。createFiles.js
で、先ほど取得したspnameSinica.txt
を元に、連想配列を作成し、input files
のすべての行を検索します。その結果が対応するファイルに出力される。
[classlist.txtファイル]に中国語名追加手順
node classifylistAddChinese.js > classifylist_zh.txt
を実行すると、
classifylist_plain.txt
が配列にスプリットされ、 spnameSinica.txt
を元に作った連想配列で検索が行われる。
https://github.com/suikoucalender/mitosearch_related_files/tree/main/filesForAddingChinese