養成講座2003 コース概略 英語科コース チュートリアル

コース種別 英語科コース
日 時 7月30日(水) 9:40~16:10
会 場 早稲田大学 西早稲田キャンパス 14号館502教室
9:40-9:50 挨拶・趣旨説明
講 師 原田康也(早稲田大学)
9:50-11:20 語彙学習の限界効用
講 師 中條清美(日本大学生産工学部専任講師)
コース概要  英文だけを眺めていても見えないことが、英文を単語単位に分解して出現頻度を数えてみると面白い事実が見えてきます。たとえば、
  1. 最も有名なところではジップの法則(Zipf’s Law)があります。単語を出現頻度順に並べたリストでは、順位 × 出現頻度 = 一定の値になるという法則です。ジップの著作のタイトル、Human Behavior and the Principle of the Least Effort にその理由が伺えます。
  2. 単純なところでは、一定のサンプル量のいろいろな英文を単語単位に分解して、その異なり語数 (type) を延べ語数(token)で除した値(type token ratio)を比較すると、英文の難しい順にTTRの値は大きくなります。より難しい英文ではバラエティに富んだ語彙が使われるからと考えられます。
  3. 効率的に単語を学習するには頻度上位の語から始めるとよい。よく作られた語彙リストを用いると、最も頻繁に用いられる1,000語だけで実用的な英文に出現する単語の約80%をカバーすることができます。3,000語で90%、7,000語でようやく95%をカバーすることができます。
  4. 頻度の高い語ほど学習者はよく知っているはずであるという仮説に立つと、頻度順リストを語彙レベル推定の基準に用いることができます。たとえば、1億語の英文を収集した British National Corpusの頻度順リストを用いて、中学教科書と高校教科書に出てくる単語をすべて習得した場合の語彙レベルや雑誌TIMEの語彙レベル、TVニュース CNNの語彙レベル、また英検1級の語彙レベルなどを推定することができます。
 本講義では上記のような語彙の計量的な観察から得られる情報を効率的な語彙学習に生かす有効な方策を追求します。
11:30-13:00 語彙検索と英語学習
講 師 内山将夫(独立行政法人通信総合研究所)
コース概要  大規模なテキストデータ(コーパス)を英語学習のために利用する方法について、デモを交えて解説します。検索ツールを用いて、読売新聞の日本語記事と、The Daily Yomiuriの英文の記事から取り出した18万対の日英文対応と約10万対の日英記事対応のデータを検索することにより、どのような知識を得ることが出来るかを示します。

 たとえば、次のようにして、英語の文章を書く場合に有効な知識を得ることが出来ます。「いかがなものか」という辞書では調べられないような表現を知りたい場合、まず「いかがなものか」という文字列を含む日本語記事を検索し、得られた日本語文と、それに対応する英語文から、それぞれ日本語と英語の特徴語のリストを得ます。日本語の特徴語から「いかが」を、英語の特徴語から「I」を選んで絞込検索(双方の語を含むようなものだけを表示する)を行うことにより、「いかがなものか」の訳として「I doubt」という表現を候補として得ることができます。

 このような手法を用いれば、最近の新聞記事を通して、新しい単語や表現の適切な訳を選択することが可能となります。なお、今回用いる対訳新聞記事データは研究利用が可能な日英対訳データとしては最大のものです。この他、日本語および英語の単言語のコーパスを対象に、さまざまな検索が可能であるツールを紹介します。

受講生の皆様へ
 受講生は日英対訳文対応付けデータのホームページより、「心と手」O・ヘンリー著をダウンロードして印刷してきて下さい。また、できれば、ダウンロードのページから、日英対訳文対応付けデータをダウンロードし、かつ、それを Note PC にインストールしてきて下さい。データを閲覧しながら受講すると、トークの内容が分りやすいと思います。トークのうちで上記データの説明に使う時間は1時間程度ですので、PCの電源はバッテリだけで大丈夫だと思います。
13:00-14:30 昼休み 展示・デモ
14:30-16:00 音声のデジタル化・圧縮と英語学習
講 師 山田玲子(ATR人間情報科学研究所)
コース概要  英語をパソコンや携帯端末や携帯電話で勉強することが流行っていますが、音声をデジタル化して圧縮すると、音質が劣化し,英語の音声を学習する上で影響を与える場合があります。ATR で研究用に開発した訓練ソフトでのデモをまじえながら、英語学習とデジタル音声の問題点に焦点をあてて解説します。