はじめに
ユーザ参加型辞書「北辞郎」へようこそ。この辞書は検索はもちろん、ユーザが自由に編集できるオンライン中日辞書です。ノートにメモを取る感覚で、単語の意味や用法、例文、その単語に関連する記事などを辞書に追加することができます。あなたが編集した内容は、辞書の利用者全員に公開されます。それによってどこかの誰かがとても助かるかも知れませんし、あなたが書いた内容を誰かがさらに発展させてくれるかも知れません。
中国や中国語に興味があるなら、それだけで辞書編集グループ「辞典幇」に参加することができます。あなたが出会った言葉を、ぜひ「北辞郎」に追加してください。
検索方法
北辞郎には次の7種類の検索方法が用意してあります。
このページの上部の入力欄に適当な中国語を入力してリターンキーを押すと検索が実行されます。デフォルトの検索オプションは前方一致検索ですので、ピンインによる検索や日本語部分の検索などを行う場合は、入力欄右側のセレクトボックスからオプションを選んでください。なお、該当する単語が辞書に収録されていない場合は、その単語を新規登録するためのリンクや外部の辞書へのリンクが表示されます。
検索オプションの入力
セレクトボックスから検索オプションを選ぶのが面倒な場合は、検索オプションを直接入力することもできます。たとえば、検索語句の先頭に「py:」を付けると、「ピンイン検索」のオプションを選択した場合と同様に検索が行われます(py:sheng3lve4など)。日本語検索は「jp:」、中国語の全文検索は「ch:」になります。上掲のリストの右側に検索オプションを書いていますのでご参照下さい。
ピンイン検索
ピンインから単語を検索したい場合は、まず半角の英字で発音を入力し、声調を1~4の半角数字で入力します。軽声は入力しません。略(lüè)などを検索したい場合は、「ü」の部分を「v」で代用してください。
[入力例] sheng3lve4
上のように入力し、セレクトボックスで「ピンイン検索」を選択した後、「Search」ボタンを押すと「省略」ではじまる言葉がいくつか表示されたと思います。なお、声調の変化を考慮する必要はありません(例えば3声+3声など)です。
声調を表す数字を入力しないでも検索を行うことはできますが、その場合はピンインの部分一致検索が行われるため、検索結果が膨大になることがあります。必要に応じ、適宜声調の数字を加えるなどして絞り込みを行って下さい。
ピンイン検索とワイルドカード
ピンイン検索を行う場合は、ワイルドカードを使用することが出来ます。うろ覚えの部分に「?」か「*」を挿入することで、探している言葉が見つかるかも知れません。「?」は任意の1文字に、「*」は任意の文字列を代替します。例えば、「xi2jian1」なのか「shi2jian1」なのか不明な場合、「*i2jian1」とすることで、どちらも検索することが出来ます。
なお、ピンイン検索で後方一致検索を行う場合は、ピンインの末尾を表す部分に「!」を入力します。たとえば「m*yi!」と入力して検索を行うと、ピンインが「m」で始まり、「yi」で終わる単語がヒットします(免疫など)。
日本語全文検索
日本語全文検索では、ひらがなとカタカナは同一視されて検索が行われます。たとえば「へちま」を検索すると「へちま」と「ヘチマ」を含むエントリが表示されます。もし「へちま」のみを検索したい場合は「"へちま"」という風にダブルクォートで検索語句を括って下さい。
複数のキーワードをスペースで区切って入力するとAND検索を行うことができます。「ブリ」を検索すると関係のない単語が多数ヒットし、肝心の単語にたどり着けませんが「ブリ 魚」と入力すると、この2つのキーワードを両方含む単語だけがヒットしますので検索結果を絞り込むことができます。
AND検索では、ひらがなとカタカナは同一視されません。「ぶり 魚」で検索しても何もヒットしませんのでご注意下さい。
日本語索引検索
日本語索引検索は、日本語の索引に対して検索を行い、情報を絞り込みます。日本語全文検索では、備考や参考情報、例文などの情報も検索対象となりますが、索引検索では語義部分のみを対象として検索を行います。
ひらがなとカタカナは同一視されず、現在のところAND検索も行えません。語義部分のみを対象に情報を絞り込みたい場合にご利用ください。
日本語索引検索でもワイルドカードが使用できます。「?」は任意の1文字、「*」は任意の文字列を代替しますので「ポ?ト」を検索すると「ポスト、ポット、ポート」がヒットし、「ポ*ト」を検索すると「ポスト、ポートレート、ポケット」などがヒットします。
検索条件の自動判別について
検索語句に「半角英数字」と「?」だけで構成される文字列を入力して検索を行うと、ピンインが入力されたと自動的に判断し、「ピンイン検索」を実行します。この場合、「?」はワイルドカードと見なされて、任意の1文字にマッチしますので、「ni?hao?」と入力して「你好」を検索することができます。
また、検索語句に平仮名や片仮名が含まれている場合は、日本語を検索しているものと判断されて、日本語検索に切り替わります。
この自動判別を回避したい場合は、検索オプションを手入力して下さい。たとえば、中国語部分に含まれる英数字だけで構成される単語を検索したい場合は、「fw:example」などとすることで自動判別を回避することができます。
編集履歴の検索
検索語句に「from:」や「since:」オプションを加えると、特定メンバーの編集履歴や指定日時以降に登録された単語のみを検索対象とすることができます。
オプションfrom:に続けてメンバー名または「me」、「everyone」を入力することで、そのメンバーが「単語」を編集した際のデータを閲覧することができます。「me」は自分、「everyone」はメンバー全員を対象に検索するためのキーワードです。
上のように入力すると2009年5月1日以降の「単語」の編集履歴を調べることができます。
部首と画数から検索する
発音などが分からない漢字を検索する場合は、部首と画数から漢字を検索することもできます。部首画数検索の画面で一覧表示される部首から、検索したい漢字に含まれている部首を選択し、その漢字の部首を除いた部分の画数を、画数入力欄に入力してください。検索を実行すると、該当する漢字が一覧表示されます。なお、画数は省略しても構いませんが、部首は必ず指定してください。
一括検索
一括検索のページでは、中国語のテキストを単語単位に分割し、まとめて辞書引きすることができます。テキストボックスに文章を入力し、Submitボタンを押すと、単語単位に分割された処理結果が得られます。
各行の先頭にある [+] アイコンをクリックすると、各行に含まれる単語を一括検索し、結果を一覧表示します。分割された個々の単語をクリックすると、その単語の意味だけを確認することができます。
ブラウザで表示しているページの選択テキストを一括検索に直接送信するためのブックマークレットを用意しました。以下の『一括検索』のリンクをドラッグ&ドロップし、ブラウザのブックマークまたはブックマークバーに登録してください。
ブックマークレット: 一括検索
漢字変換
漢字変換のページでは簡体字、繁体字、日本の漢字を相互変換するほか、簡体字からピンインへの変換を行うことができます。対応している変換の組み合わせは以下の通りです。
- 簡体字からピンインへ
- 簡体字から繁体字へ
- 簡体字から日本語へ
- 繁体字から簡体字へ
- 繁体字から日本語へ
- 日本語から簡体字へ
- 日本語から繁体字へ
簡体字からピンインへ変換する際は、出力形式として声調記号付きのピンインと声調を数字で表した簡易ピンインのどちらかを選ぶことができます。なお、漢字変換で一度に変換できる文字数は2000文字までとなっています。
謝謝について
北辞郎で単語の検索を行うと画面の右側に[ 謝謝 ]というリンクが表示されます。これは、その単語を登録した人に感謝のメッセージを送るためのリンクになります。北辞郎は、メンバー(辞典幇)がこつこつ入力した辞書データによって成り立っています。もし、あなたが北辞郎を検索して、調べていた単語が見つかったら、是非「謝謝」を送って下さい。その「謝謝」によって、辞書はもっともっと充実するかもしれません:-)
単語の編集
検索結果から編集用リンクをクリックし、表示される編集画面にて編集を行います(要ログイン)。
編集画面では、その単語の登録情報に関して投稿された「コメント」や「編集履歴」が確認できるほか、編集内容を「プレビュー」する機能が用意されています。編集に慣れていない間は、自分の投稿がどのように反映されるか「プレビュー」してから「登録」を行うようにしてください。編集し終わったら、画面下部の「登録」ボタンをクリックして編集を完了します。
〈編集画面〉
辞書を編集すると、その情報はシステムに記録され、トップページに更新記録として表示されます。また、将来的になんらかのかたちで、この辞書から利益が生じた場合は、辞書の編集、新規登録の回数によって、その利益が分配されることになります。詳しくは利用規約を確認下さい。
なお、編集画面の下部には、「ちょっとした更新」のチェックボックスがあります。ここをチェックすると、編集履歴に記録はされますが、トップページには表示されなくなります。単語の情報を編集した後で間違いに気がついた場合など、少しだけ手直ししたい場合にご利用下さい。
単語の削除
自分が編集、登録した単語に限りますが、「メニュー」の「編集履歴」から削除を行うことができます(登録者が自分だけの場合は、履歴を削除すると単語そのものが削除されます)。
辞書の入力書式
辞書は一定の書式を備えていなければなりません。以下に書かれている全てを覚えておく必要はありませんが、できる限りこの入力形式にしたがって、編集を行うようにして下さい。
中国語の入力
簡体字、繁体字どちらでも登録することができます。
入力欄には、単語1つのみを入力します。複数の単語をスペースや読点で区切って入力することはできません。
外国人の姓と名前を区切る記号には间隔号(U+00B7)全角の中黒「・」を用い、歇后語の前半部分と後半部分の区切りには全角の逗号「,」を用います(慣用句などに逗号が含まれる場合も全角の逗号を用います)。
「一边……一边……」のように見出し語の一部を省略する場合は、その省略する部分を「……」(省略号=3点リーダー2つ)で表現します。対応する日本語訳については「~しながら~する」のように「~」を使うか、「…」(3点リーダー1つ)を使って省略部分を表現します。
繁体字と簡体字について
北辞郎には、台湾や香港などで使われている繁体字の単語を登録することもできます。簡体字で登録するか、繁体字で登録するか迷った場合は、基本的にその単語が登場した文章で使われている漢字に従うようにしてください。
「アルカリ性」のように台湾(鹼性)と大陸(碱性)で漢字が異なるものの、意味や用法に違いがない場合は、どちらで登録してもOKです。両方登録しても構いません(リンク記法でリンクしておくと便利です)。
大陸の「爱人」には、「配偶者」の意味がありますが、台湾の「愛人」は日本語の「愛人」と同様の使われ方をするようです。このように漢字だけでなく、意味や用法が異なる単語は、簡体字と繁体字の両方で単語登録を行い、備考などを加えておくと良いでしょう。
「ソフトウェア」のように台湾(軟體)と大陸(软件)で表記そのものが異なるような単語は、それぞれ登録を行い、[[と]]を利用したリンク記法を使って、2つのエントリ同士を関連づけると利用者にとって便利です。
その際、たとえば「軟體」のエントリで「软件」へのリンクを張る場合、「软件」の前には〈簡〉タグを追加します。反対に簡体字のエントリから繁体字のエントリにリンクを張る場合は〈繁〉タグを使用します。
入力例:软件
〈電脳〉ソフトウェア 〈繁〉[[軟體]]
儿化について
「儿化」する単語については、儿化前の基本形で登録を行います。儿化することを明示したい場合は、日本語の入力欄に「〈儿化〉」のタグを入力し、その後に儿化した単語を入力したり、あるいはその単語の意味を入力します。
ピンインの入力
半角の英数字でピンインを入力します(声調記号などを入力すると利用者が簡単に検索できなくなるため)。なお、ピンイン入力欄の下にある「Pinyin」ボタンを押すとピンイン候補が自動入力されます。
- 「一」や「不」の声調の変化は反映させません。「一」は一声、「不」は四声で入力します。
- 軽声は入力しません。
- 単語に複数の読みがある場合は、読みと読みの間を半角の「/」で区切ります。
品詞の入力
品詞記号については、こちらを確認ください。この項目は必須項目ではありません。
部首画数の入力
部首については、こちらの部首一覧を確認ください。画数は、部首を除いた残りの部分の画数となります。入力形式は「部首記号/画数」という風に、部首と画数を半角スラッシュで区切るかたちです。複数の部首がその漢字に含まれる場合は、「部首記号/画数;部首記号/画数」のように、半角のセミコロンでそれぞれを区切って登録することもできます。こうした情報は部首画数検索機能で使用されます。
入力例:结(jie2)の部首画数
日本語の入力
日本語欄には800文字まで入力することができます。日本語欄では書式統一のため辞書編集用の特殊な記法を用います。
1.以下は「表现」の日本語入力例となります。このように複数の用法がある場合は、行頭に半角の「+」を入力すると、表示の際に番号付きのリストに変換されます。
+表現する.表す +態度.表れ +自分をひけらかす.見せびらかす
単語が複数の意味を持つ場合は、訳語間の区切りに全角のピリオド「.」を用います。ただし、英語訳を登録する場合は、各訳語の間を全角のセミコロン「;」で区切ります。
2.「下发」のように複数の読みがある場合は、行頭に半角のアスタリスク「*」を挿入してからピンインを入力し、次行にその発音に対応する意味を入力します。
*xia4fa1 (文書や通達などを)下部に配布する *xia4fa4 髪をおろす
3.同義語や関連語句を入力する場合は、[[と]]で括れば自動リンクが行われます。以下は「中国」の入力例となります。
〈国名〉中国 〈関連〉[[北京]] 〈同〉[[神州]]
入力例2:不仅
+単に~であるだけでなく +~にとどまらない 〈類〉[[不止]]/{{不但}}
その単語に対応する反義語、同義語、類義語が複数ある場合は、それらを半角のスラッシュで区切ってください。上述したように[[と]]で括ると、その単語にジャンプするためのリンクが自動的に張られます。リンクをする必要がない場合は{{と}}で括ります。
なお、編集中のエントリが略語である場合、日本語欄の先頭に〈略〉タグを入力し、語義を入力した上で、同義語タグ〈同〉を利用し、省略されていない正式名称のエントリにリンクを張ってくと便利です。
入力例:中行
〈略〉中国銀行 〈同〉[[中国银行]]
4.例文を入力する場合は、次のように入力します。以下は「结果」の入力例となります。
+結果
〈例〉{{浏览检索结果}}=検索結果を閲覧する
+結局.挙げ句の果て
+殺す.とどめを刺す
「结果」という単語には、複数の意味があります。例文を入力する場合、各意味に続けて記述しないと、どの意味に対応する例文なのかが分からなくなるので、意味を入力後、改行して例文タグ〈例〉の後ろに「{{例文}}=その意味」の形式で入力します。{{ と }}で中国語部分を括っておくことで、検索時にその部分が適切な中国語フォントで表示されるようになります(文字化け対策です)。
例文を複数入力する場合は、例文の間を半角の「 / 」で区切るか、各例文の行頭に〈例〉タグを入力します。下記を参照ください。
1.複数の例文を半角スラッシュで区切る方法 〈例〉{{中国語}}=日本語 / {{中国語}}=日本語 / {{中国語}}=日本語 2.例文ごとに改行し、行頭に〈例〉タグを入力する 〈例〉{{中国語}}=日本語 〈例〉{{中国語}}=日本語 〈例〉{{中国語}}=日本語
上記のように入力していただければ、システム側が体裁を整え、リスト表示されます。
※引用元、参考文献について
例文の引用元や参考文献を記載する場合は、次のように記述します
1.引用元(リンク) 〈例〉{{中国語}}=日本語((サイト名など|URL)) 2.参考文献 〈例〉{{中国語}}=日本語((著者名、書名、?版表示?、?出版社?、?ページ数?))
まず、例文の引用元を明記する場合は、半角の括弧を二重に用いてサイト名とURLを囲み、両者の間を半角の縦線(|)で区切ります。この記法を用いると外部サイトへのリンクを表すアイコンに変換されます。(表示例:)
参考文献を記す場合は、上記のように著者名、書名などを((と))で囲みます。著者名、書名は必須としますが、それ以外の情報は任意です。この記法を用いると本のアイコンに変換され、そのアイコンをクリックすると文献の情報をクリップボードにコピーできます。(表示例:)
5.備考などを入力する場合も、例文などと同じように意味ごとに記述をまとめます。
+結果
〈例〉{{浏览检索结果}}=検索結果を閲覧する
+結局.挙げ句の果て
〈備考〉{{结果}}は接続詞的な使われ方をすることも多い
+殺す.とどめを刺す
北辞郎は辞典であり、言葉の意味、例文、用法などの登録を主目的としています。備考や参考情報を登録し、その単語についての情報を登録することは理解を深める助けとなりますが、簡潔に記述し、百科事典的な情報は外部サイトへのリンクで対応するようにしてください。また、伝聞や個人的な体験に基づく情報の登録は避けてください。
6.属性タグの入力
属性タグは専門用語の分類に用います。形式は〈分野名〉のように、その単語に該当する分野名を山パーレン(山形:〈 〉のことです)でくくって、日本語訳の先頭に加えます。属性タグの入力補助メニューから入力することもできます。
例えば「邮件炸弹」の日本語訳を入力する場合は、以下のようになります。
〈電脳〉メール爆弾.メールボム
属性タグは、好きなように作成して構いません。上記のようにおおざっぱに〈電脳〉としても、より具体的に〈黒客〉や〈網絡〉などとしても問題ありません。ただ、冗長すぎる表現はできるだけ避けて、〈 〉内は漢字2文字程度でまとめ、さらに他の辞書利用者が参照した際に、容易に理解できるタグになるよう工夫してください。
また、上記の分野別タグ以外のタグに〈修正歓迎〉があります。これは、新規登録で訳語に確信が持てない場合に使用します。登録はしておきたいけど訳語に自信がない単語に、このタグを付けておくことで、他のメンバーが抵抗なく編集できます。訳語の調査に行き詰まったときに、とりあえず北辞郎に登録し、修正歓迎タグを付けておくことで、他のメンバーに助けてもらえるかもしれません。
7.ふりがなの入力
日本語訳に含まれる難読字にふりがなを付けたい場合は、半角のブレースを使って「漢字{ふりがな}」または「{漢字|ふりがな}」のかたちで入力します。半角のパイプライン「|」を使う後者の記法は、連続している漢字の一部のみにふりがなを振る場合に使用します。たとえば、「水素脆化」にふりがなをを付けたい場合は、「水素{脆化|ぜいか}」とします。
※なお、ふりがなは読むことが難しい漢字にのみ振るようにしてください。何にでもふりがなをつけると見にくい上、日本語検索時にうまくヒットしなくなります。
漢字{かんじ}の送{おく}り仮名{がな} / 水素{脆化|ぜいか}
このように入力すると次のように表示されます。
Firefoxでルビを利用したい場合はXHTML Ruby Supportを導入してください。
※Firefoxのバージョン38からはRubyタグがサポートされています。
8.内部リンクの入力
内部リンクの入力については、3.同義語や反義語などをご参照ください。9.外部リンクの入力
単語に関する参考情報として外部サイトへのリンクを記入する場合は、リンク記法を使います。例えば、ビートルズの参考資料として百度百科にリンクしたい場合は、次のように[[URL(半角か全角のスペース)タイトル]]のかたちで入力します。
[[http://baike.baidu.com/view/25331.htm 百度百科のビートルズ]]
すると、次のように表示されます。
タイトル部分に中国語を使いたい場合は、{{と}}で括ります。[[http://baike.baidu.com/view/2197119.htm 百度百科の{{林戈·斯塔尔}}]]
必要に応じ、行頭に〈参考〉タグを追加することで、参考情報であることをより明確に示すことができます。
10.方言の扱い
広東語をはじめとする方言を登録する際、登録する文字種は簡体字でも繁体字でもかまいません。発音に関しては、検索する利用者の便を考慮し、標準語のピンインで登録してください。方言特有の発音を登録しておきたい場合は、日本語入力欄に〈発音〉タグを入力し、それに続けて方言特有の発音を入力します。こうしておくと、利用者は日本語の全文検索を行うことで、その発音を検索することができます。また、その方言がどの地方の方言なのかを括弧書きや備考として書き加えておくと、利用者にとってよりわかりやすいものとなります(ただし、こうした作業は手間がかかるので必須ではありません。余力があれば発音や追加情報を登録してください)。
11.長音表記について
外来語の語尾などに長音記号「ー」を付けるかどうかで迷う場合は、以下のガイドラインをご参照ください。
1.英語の語尾が‐er、‐or、‐ar、 *y にである場合は、原則として長音とします。
例:コンピューター(computer)、エレベーター(elevator)、カレンダー(calendar)、アクセサリー(accessory)
2.英語で発音記号が"ei"、"ou"などのアクセントのある二重母音になる場合(ai、a+子音字+e、oなど)は長音にします。
アベレージ(average)、イミテーション(imitation)、インジケーター(indicator)、インフォメーション(information)、エスカレーター(escalator)、エレベーター(elevator)、オーディオ(audio)、オーナー(owner)、オーバーコート(overcoat)、クリエーティブ(creative)、ケース(case)、シェード(shade)、シミュレーション(simulation)、スケール(scale)、スペース(space)、セーフティー(safety)、チェーン(chain)、トレーナー(trainer)、ネーム(name)、プレーヤー(player)、ページ(page)、メーカー(maker)、メッセージ(message)、メール(mail)、レーザー(laser)
3.英語の語尾が‐re であるう場合は、原則として長音符号「ー」を付けません。
例:グラビア(gravure)、ケア(care)、コア(core)、フィギュア(figure)、ファームウェア(firmware)、フリーウェア(freeware)
ただし、英語の語尾が‐ture、‐sure の場合は長音符号「ー」を付けます。
アドベンチャー(adventure)、アーキテクチャー(architecture)、カルチャー(culture)、ディスクロージャー(disclosure)、プレッシャー(pressure)
長音の例外:
1.語尾の母音の直前に、強勢(ストレス)のある別の母音がある場合は例外とします。
例:ウエア(wear)、ケア(care )、ストア(store )
2.「エー」「オー」と書かず、「エイ」「オウ」と書くような慣用のある場合は、そちらに従います。
例:エイト、ペイント、レイアウト、スペイン、ケインズ、サラダボウル、ボウリング、インターフェイス(interface)、ドメイン(domain)、ボウル(bowl)、メイン(main)、メンテナンス(maintenance)、レインコート(raincoat)
12.外来語の表記について
訳語として外来語を登録する場合、たとえば餃子を「ギョーザ」と表記するのか、「ぎょうざ」するのかについては、一般的な表記にあわせて長音「ー」や拗音「ァ・ィ・ゥ・ェ・ォ」を使用するかたちとします。餃子は「ギョーザ」、Teenは「ティーン」としますが、「ヴァ・ヴィ・ヴ・ヴェ・ヴォ」は「バ・ビ・ブ・ベ・ボ」に統一し、Violinは「バイオリン」と表記します。
13.ピンインの入力について
日本語欄にピンインを入力する場合は、声調付きのピンイン記号ではなく、声調を数字で表す簡易ピンイン記号に「py:」を加えるかたちで入力します(下記参照)。
py:ni3hao3
このように記述すると「nǐ hǎo」に変換されます。
単語の一括登録
幇員専用菜単から「ファイルをアップロードして単語を一括登録」を実行すると、テキストファイルをアップロードして単語を一括登録することができます。
登録ファイルのサンプルはこちらを参照ください(文字化けする場合は、表示エンコードをUTF-8にしてください)。テキストファイルの書式や制限事項については下記をご確認ください。
- テキストファイルの書式と制限事項:
- テキストファイルの文字コードはUTF-8とします。
- テキストファイルの先頭行には、必ず「北辞郎用ファイル」と記入してください。北辞郎のシステムは、この行を利用して文字コードのチェックを行います。
- 中国語、品詞、ピンイン、日本語、部首画数の5項目をタブで区切り、1データを1行にまとめてください。
- 中国語: Unicodeに含まれている漢字であれば、簡体字以外も登録可能です。ただし、ファイルからの一括登録では漢字と「・」(中黒)および「,」(読点)以外の文字は登録できません。
- 品詞: 品詞記号については「品詞記号」を参照ください。
- ピンイン: 声調記号を数字で代替する簡易発音表記で登録してください。中黒や読点は、そのまま入力してください。
- 日本語訳: 改行を入れたい箇所には「■」(全角の黒四角)を挿入してください。
- 部首画数: 「部首/部首を除いた残り部分の画数」の形式で登録してください。例えば「林」という漢字の部首画数データは「木/4」となります。この項目は登録したい単語が単漢字の場合に必要となります。それ以外の場合(つまり一般的な単語)は、「?」を登録してください。部首についてはこちらの部首一覧を確認ください。
- すでに辞書に登録されている単語を上書きすることはできません。新規登録のみが可能です。
- 一度に登録できる単語数は50語までに制限されています。
- この機能は、100語以上登録したメンバーのみ利用することができます。
- 上記各項目は、下記の書式に合致していなければなりません。
一括登録用ファイルの作成:
上図はエクセル上で作成した単語帳です。このデータ(AからEまで)をコピーしてテキストエディタなどに貼り付けると、各項目間がタブで区切られた状態のデータを貼り付けることが出来ます。貼り付けた後、先頭行に「北辞郎用ファイル」と記入してください。その状態でテキストファイル(文字コードはUTF-8)として保存すれば、データファイルの出来上がりです。
部首一覧
北辞郎で使用されている部首は、以下の通りです。画数を入力する際は、その漢字から部首の画数を除いた画数を入力してください。繁体字の部首に対応するため、今後この項目は修正される予定です。
品詞記号について
北辞郎で使用されている品詞記号は、北京大学计算语言学研究所の汉语文本词性标注标记集を参考にしています。以下に主だった品詞記号を列挙します。これ以外の品詞記号も使用していますが、辞書の編集に必要となるのは、だいたい以下の記号類だと思います。複数の品詞に該当する単語である場合は、品詞記号間を半角のハイフン「-」で区切ってください。
記号 | 名称 | 備考 |
a | 形容詞 | adjectiveの略 |
b | 区別詞 | 「別」の発音から |
c | 接続詞 | conjunctionの略 |
d | 副詞 | adverbの2文字目から |
e | 感嘆詞 | exclamationの略 |
f | 方位詞 | 「方」の発音から |
g | 語素 | 「根」の発音から。単体では意味をなさない漢字や記号などが含まれる |
h | 接頭辞 | headの略 |
i | 成語 | idiomの略。ただし、北辞郎では成語もその役割に応じて、動詞や形容詞といった品詞が振られている場合が多い |
j | 略語 | 「簡」の発音から。ただし、北辞郎では略語の多くは名詞に分類されている |
k | 接尾辞 | |
l | 習用語 | 習用語尚未成為成語,有点“臨時性”,取“臨”的声母。 |
m | 数詞 | numeralの3文字目から。 |
n | 名詞 | 取英語名詞noun的第1个字母。 |
NR | 人名 | 名詞「n」+「人(ren)」 |
NS | 地名 | 名詞「n」+場所詞「s」 |
NT | 組織 | 名詞「n」+「団(tuan)」 |
NZ | その他固有名詞 | 名詞「n」+「専(zhuan)」 |
o | 擬声語 | onomatopoeiaの略 |
p | 介詞 | prepositionalの略 |
q | 量詞 | quantityの略 |
r | 代名詞 | pronounの2文字目から |
s | 場所詞 | space略 |
t | 時間詞 | timeの略 |
u | 助詞 | auxiliaryの2文字目から |
v | 動詞 | verbの略 |
w | 句読点や記号 | |
x | 英字など | |
y | 語気助詞 | 「語(yu)」の発音から |
z | 状態詞 | 「状(zhuang)」の発音から |
北辞郎APIを用いて検索や編集を行う
GETまたはPOSTで構築したリクエストを指定されたURLに投稿することで、処理結果をXMLで得ることができます。
リクエストパラメータ
GETまたはPOSTでリクエストを構築します。
パラメータ | 値 | 説明 |
mode | string | search(検索)またはedit(編集)を指定します。 |
検索用のパラメータ | ||
word | string | 検索対象の単語です。文字列のエンコードはUTF-8であるものとします。 |
option | string | 検索対象のオプションを指定します。fw(中国語前方一致), jp(日本語), py(ピンイン), rd(部首画数), ch(中国語全文), bw(中国語後方一致), ex(中国語完全一致)のいずれかとします。オプションを省略すると中国語の前方一致検索となります。 |
編集用のパラメータ | ||
uid | string | 北辞郎のユーザID(メールアドレス) |
pw | string | md5で暗号化された北辞郎の登録パスワード |
chn | string | 中国語 |
pyn | string | ピンイン |
jpn | string | 日本語 |
rad | string | 部首画数 |
pos | string | 品詞 |
リクエストURL
「花」(%E8%8A%B1)を検索するURLは次の通り(オプション省略=中国語前方一致)
http://www.ctrans.org/api.php?mode=search&word=%E8%8A%B1
レスポンスフィールド
フィールド | 説明 |
ResultSet | 処理の全結果が含まれます。 |
Result | 処理結果1件を返します。 |
chn | 中国語 |
pyn | ピンイン |
jpn | 日本語。wiki風の簡易記法を採用しているため、処理結果を利用する際は整形する必要があります。なお、改行は「■」で表現されています。 |
rad | 部首画数 |
pos | 品詞 |
※登録されていないフィールドには「?」が入ります。 |
検索のサンプルレスポンス
「花」を検索オプションなし(中国語の前方一致)で検索した結果(最大25件)
<?xml version="1.0" encoding="UTF-8" ?> <ResultSet> <Count>25</Count> <Result> <chn>花</chn> <pyn>hua1</pyn> <jpn>+花■+花のようなもの■+花火■+模様.柄■+色とりどりの■+目がかすむ.ちらつく■+うその.誠意のない.嫌らしい■+精華(~の華)■+美人■+娼妓.妓女■+綿.綿花■+天然痘■+戦地での負傷■+使う.消費する.費やす■+けがをさせる.傷つける■+姓■〈関連〉化■(量)朵/枝/束■/簇(cu4)</jpn> <rad>艹/4</rad> <pos>a-n-v</pos> </Result> <Result> <chn>花中之王</chn> <pyn>hua1zhong1zhi1wang2</pyn> <jpn>百花の女王(特にボタンをさす)</jpn> <rad>?</rad> <pos>?</pos> </Result> <Result> <chn>花仙子</chn> <pyn>hua1xian1zi3</pyn> <jpn>〈アニメ〉花の子ルンルン</jpn> <rad>?</rad> <pos>n</pos> </Result> ~中略~ </ResultSet>
該当するデータがない場合はフィールド<Count>が0となります。検索結果は最大25件まで得ることができます。
編集のサンプルレスポンス
フィールド<Count>がない以外は、検索のレスポンスと同様です。以下は「花中之王」を編集したところ。
<?xml version="1.0" encoding="UTF-8" ?> <ResultSet> <Result> <chn>花中之王</chn> <pyn>hua1zhong1zhi1wang2</pyn> <jpn>百花の女王■〈備考〉特にボタンをさす</jpn> <rad>?</rad> <pos>l</pos> </Result> </ResultSet>
エラーのサンプルレスポンス
検索、編集ともにエラーメッセージを返します。
<?xml version="1.0" encoding="UTF-8" ?> <ResultSet> <Error>エラーメッセージ</Error> </ResultSet>
スマートフォン用アプリ
北辞郎にはiPhone用のアプリとアンドロイド用のアプリがあります。
※アプリのサポートは、各アプリの作者が行います。アプリに対する要望などは作者にご連絡ください。
デスクトップ用アプリ
オフラインでも利用可能なデスクトップ用ツールは下記で公開されています。
※アプリのサポートは、各アプリの作者が行います。アプリに対する要望などは作者にご連絡ください。
北辞郎のサテライトサイト
北辞郎にはサテライトサイトが用意されています。一部機能が制限されていますが、本家北辞郎と同様に検索、編集を行うことができます。
自分のサイトに北辞郎の検索窓を
ホームページやブログをお持ちの場合、以下のソースを適当な場所に挿入することで、北辞郎の検索窓を設置することができます。
※検索窓を設置するには Javascript が使用できる環境である必要があります。
iGoogleへの追加
iGoogleを利用されている方は、以下のボタンをクリックすることで北辞郎のガジェット(暫定版)を追加することができます。
Gmailでの利用
Gmailにも北辞郎のガジェットを追加することができます。中国語のメールに出てきた単語を調べるときにたいへん便利です
- Gmailの設定(settings)を開いてLabsのタグを選択
- 表示されるリストで「URLでガジェットを追加(Add any gadget by URL)」を選び、「有効(Enable)」にします。
- 設定が反映され、リロードが終わると「設定」に「ガジェット(Gadgets)」タブが追加されます。
- URLを入力する欄がありますので「http://www.ctrans.org/cjdict.xml」と入力します。
- 「追加」を実行すると、Gmailのサイドバーに北辞郎のガジェットが表示され、そこから北辞郎の検索が行えるようになります。
ブックマークレットを使って検索
ブックマークレットを使うことで北辞郎で素早く検索することができます。durian氏が作成されたブックマークレットを利用すると、ブラウザで選択している文字列を1クリックで北辞郎に送り、検索することが可能です。文字列をコピーして、ブックマークから北辞郎を開き、貼り付けて検索、という手間を省くことができ、たいへん便利です。PCのブラウザだけでなく、iPhoneのSafariで利用できるブックマークレットも用意されています(感謝!)。
- パソコンのブラウザ用ブックマークレット
- iPhone用のブックマークレット (いずれも外部サイト「天網快快」へのリンクとなります)
ブラウザで表示しているページの選択テキストを一括検索に直接送信するためのブックマークレットについては、以下の『一括検索』のリンクをドラッグ&ドロップし、ブラウザのブックマークまたはブックマークバーに登録してご利用ください。
ブックマークレット: 一括検索
ダウンロード
辞典幇のメンバーは、これまでに編集した単語情報(編集履歴)をダウンロードすることができます。「幇員専用菜単」の「これまでに登録したデータをダウンロード」をクリックしてください。ダウンロード可能な形式が表示されます。ダウンロード形式は、「タブ区切り形式」、「PDICの一行テキスト形式」、「Google-IME形式」、「Xin形式」、「Google翻訳ツールキット形式」から選択することができます。
- タブ区切り形式
「中国語 / ピンイン / 品詞 / 日本語 / 部首画数」の5項目がタブで区切られたデータ形式です。テキストファイルの文字コードはUTF-8です。 - PDICの一行テキスト形式
Unicode版PDICでインポート可能な形式です。PDICの「tools」メニューから「辞書変換」を行い、ダウンロードしたファイルをPDIC形式に変換することで、PDICで利用可能となります。なお、ダウンロードされるファイルは文字コードがUTF-16のテキストファイルで、ファイルの先頭にBOMが付されています。 - Google-IME形式
Google中国が提供するIMEである谷歌拼音输入法でインポート可能な形式です。谷歌拼音输入法の「属性设置」から「词典」タブの「导入」を実行し、ダウンロードしたファイルを選択することで、IMEで利用することができるようになります。 - Xin形式
翻訳エディタXinのユーザ辞書としてインポート可能な形式です。Xinのメニューで「ツール」→「対訳DBとユーザ辞書」→「ユーザ辞書の新規作成」を実行し、ダウンロードしたファイルをソースファイルとして選択すれば、ユーザ辞書を作成することができます。 - Google翻訳ツールキット形式
Google翻訳者ツールキットの用語集としてインポート可能な形式です。中身はUTF-8のCSVファイルで先頭に言語の組み合わせが定義してあります。
なお、このダウンロードデータについての質問は「幇員専用菜単」の回覧板までお願いいたします。
注意事項
Google-IME形式のファイルは、タブ区切りのテキストファイルで中国語、数字の1、ピンインの3項目で構成されています。ピンインが登録されていない単語は、無視されます(ダウンロードされません)のでご注意ください。
なお、このファイルの文字コードはGB2312です。北辞郎の文字コードはUTF-8であるため、UTF-8からGB2312への変換を行っていますが、この変換時に文字化けが生じることがあります(繁体字データなどが化けます)。ダウンロードしたファイルを利用する際は、インポートに先だってファイルの内容を確認し、化けているデータを削除することをおすすめします。
また、上述のタブ区切りの書式は、谷歌拼音输入法がエクスポートする形式をまねしているだけで、2項目の数字部分が何を表しているのか把握できていません。不具合が生じる可能性もありますので、利用の際はユーザー辞書を保存しておくことをおすすめいたします。空行が存在する場合や中国語部分に漢字以外が含まれる場合、ピンイン部分にアルファベット以外が含まれている場合は、インポートに失敗するようです。
免責事項
本ウェブサイトに掲載された情報の完全性、正確性、有用性、安全性等について、辞典幇はその向上に努めますが、利用者が北辞郎に登録されているデータを使用し、何らかの不利益・損害を被ったとしても、管理人および辞典幇は一切の責を負いません。ご了承ください。
なお、北辞郎を使うには、クッキーとJavascriptが有効になっている必要があります。
動作確認はChromeとFirefoxで行っています。サイトの文字コードはUTF-8です。文字化けする場合は、表示エンコードをUTF-8にしてください。また、中国語のオンライン辞書ですので、お手持ちのパソコンに中国語フォントと中国入力用のIMEがインストールされている必要があります。