2010年3月17日水曜日

日本語コーパスワークショップ

今週は月・火と東工大の蔵前会館で,科研費特定領域研究「日本語コーパス」のワークショップがあったので,一部に参加してきた.東急目黒線というのは初めて乗ったのだが,どの駅もピカピカで広々としたホームには防護柵があって,心地が良い.私が通勤で常用している西武新宿線とはえらい違いだ(狭くて毎晩人が溢れそうになっている高田馬場のホームをなんとかして欲しい).昼食時に東工大がある大岡山駅の商店街をうろうろしてみたが実に感じが良かった.八百屋,魚屋,肉屋,豆腐屋,米屋,酒屋が並んで普通に賑わっているのは,結構珍しいのではないだろうか.

私はデータ処理やツール作成などのコーパス自体の研究というのはやっていないが,理論的研究に統計的な視点を加えるのには興味がある.特に形態論,レキシコンの研究というのは,母語話者の直感(内省)があまり当てにならないことも多いし,使用頻度が語彙構成に与える影響というのは認知科学的な研究では無視することはできないので,コーパスの存在はとてもありがたいものである.ただ大規模なコーパス構築には人的労力が膨大になるため,今回の領域研究というのはその意味でも意義深いものである.利用する立場の我々研究者もプロジェクトに関わっている各分野の方々に感謝せねばならない.

今回のワークショップの導入で言及されていた,素人的視点の「コーパス構築は業者に委託すればいい」や「コーパスは役に立たない」といった的外れの批判もこれまであったようだけれど,国立国語研究所も独立行政法人から大学共同利用機関法人になって,運営が比較的スムーズに行きそうとのことなので,がんばっていただきたい.
 
QLOOKアクセス解析