Thursday 15 December 2011

Ngram Viewer

twitter 経由で,面白いものを見つけた.
google が google books の近傍で提供しているサービス, Ngram Viewer .
詳しい説明はここにあるが,一部抜粋すると
When you enter phrases into the Google Books Ngram Viewer,
it displays a graph showing how those phrases have occurred in a corpus of books
(e.g., "British English", "English Fiction", "French") over the selected years.
1 単語で出来てるのは unigram, 2 単語なら bigram 一般には n-gram と呼んで,
それぞれの中でのパーセンテージを示してくれるようだ.

これは際限なく遊べるツール.表現の趨勢とかを見るのも楽しいし,実利的にもなるかも.
Soviet Union とか見たらばっちりソ連の成立の辺りからぐぐぐっと持ち上がってる.
corpus も色々から選べるから,例えば有名どころで,
携帯電話をいう言葉をで比較するとくっきり違いが見える(以下,画像はすべてこのサービスのキャプチャ).
上がBritish,下がAmerican.

いやほんとに面白くてもう(((

大文字と小文字は区別されるので.empire と Empire を検索してみると,

赤がEmpire,青がempire

こんな感じになって,empire が廃れてる雰囲気がある.
一般名詞としての empire から,固有名詞,歴史用語的なEmpire に移っていったのかもしれぬ.

他にも色々遊んだけどあんまり一辺に出すのもアレなので,一旦こんなもんにしよう.

ただ無論色々良く考えて使わないと,あくまで全体のなかの割合,やから,
他の分野の言葉がだだっとふえたら その分相対的に量は減って見える.
書くのめんどくさいけどまあ,他にも沢山「ついつい陥ってしまいそう」な誤解はありそうだから,
きちんと頭を働かせながら利用していきたいところ.

しかしほんとに面白いなぁ.
電子辞書があれば前から順に繰っていっていくらでも時間潰せるタイプなので, なんとも楽しくて嬉しい.

No comments:

Post a Comment