Willem JM Levelt 氏と同僚の Antje Meyer 氏およびArdi Roelofs 氏は、「語彙選択」と「フォーム エンコーディング」という 2 つのコンポーネントを想定しています。たとえば、世界の状況により、話者が馬について話す必要がある場合、まずこの生き物を表す単語が「語彙選択」で検索されます。このプロセスには約 600 ミリ秒かかります。これにより、話者が移動したいレベルも決まります。その生き物は一般的に「動物」と呼ばれるべきでしょうか、それともより具体的には「馬」と呼ばれるべきでしょうか?それとも「牡馬」か「牝馬」かを区別することさえ重要なのでしょうか?
適切な言葉の後には? 「馬」のこと?を選択すると「シェイプコーディング」に入ります。ここでは、/pf/、/e/、/r/、/d/ などの音韻鎖が最初に検索されます。これは約 40 ミリ秒の時間枠で発生します。次に、音素は音節に処理されます。このプロセスはすでにコンテキストと密接に結びついています。なぜなら、「馬」だけを形成する必要があるのか、「馬(の)」を形成する必要があるのかの違いがあるからです。脳は音節を処理するのに約 25 ミリ秒かかります。最後のステップでは、単語全体の音声が生成されます。 (音韻上の順序は、いわば大まかな近似にすぎません。音声処理によってのみ、「horse」が実際に [pfært] のように聞こえることが保証されます)。
研究者らは、多数の実験を使用して、この言語生成の考えられるプロセスを特定しました。たとえば、研究者らは、探している単語 (ここでは「馬」) と関係のない名詞 (例: 「椅子」) に名前を付けると、適切な単語を見つけることがどの程度難しくなるかをテストしました。また、音声的に似た単語(「ポンド」など)が音韻処理を加速するかどうかもチェックしました。音が似ている単語に名前を付けると明瞭化が速くなるという発見から、研究者らは、言語生成プロセスには、意味を区別する単位(音素)を正しく分類するためだけに存在するポイントがあるに違いないと結論付けています。
Willem Levelt のチームによる研究では、音声生成システムが驚くべき信頼性と堅牢性で動作することも示されています。人間は信じられないほどのスピードで言葉を世に送り出す準備をしているにもかかわらず、音声学的または意味論的に的外れなのは 1,000 単位に 1 回だけです。

