トークン|LLMO用語集

トークン

トークンとは、大規模言語モデルが自然言語を処理する際にテキストを分割した最小のデータ単位のことです。

AIは入力された文章を文字列としてそのまま認識するのではなく、トークンという単位に変換してから計算処理を行います。

大規模言語モデルには、一度に入力して処理できるデータ量に上限が設定されています。

この上限はトークン数で管理されており、コンテキストウィンドウと呼ばれます。

入力するプロンプトのトークン数と、モデルが生成する出力のトークン数の合計がこの上限を超えることはできません。

上限を超えた場合、モデルは過去の文脈を失ったり、計算処理を停止したりします。

そのため、LLMOにおいてAIから目的の出力を引き出すためには、プロンプトのトークン数を管理する設計が求められます。

不要な情報を取り除き、定められたトークン数の制限内で的確に指示を与えることが、モデルの性能を引き出すことに繋がります。

目次

トークンについてよくある質問

トークンとは何ですか?初心者にもわかりやすく教えてください。

人間が文章を読むとき、文字や単語の集まりとして意味を理解します。
AIも同じように、文章を読み取るためにテキストを細かく区切ります。
このAIにとっての最小の区切りの単位がトークンです。
例えば、「こんにちは」という言葉をAIが読み込むとき、それをいくつかの細かいデータに分けて認識します。
この分けられた1つ1つのデータがトークンに該当します。
私たちが文字数で文章の長さを測るように、AIはトークンの数でデータの大きさを計算します。
AIが一度に読み書きできるデータの量には決められた限界があるため、トークンの数を把握することはAIを正しく動作させるための基本となります。

日本語と英語では、トークンの数え方に違いはありますか?

言語によってトークンの分割方法が異なるため、同じ意味の文章でも消費されるトークン数に違いが生じます。
英語は単語ごとに空白で区切られているため、基本的には1単語が1つのトークンに相当することが多いです。
一方、日本語は単語の間に空白がなく、漢字やひらがななどの複数の文字種が混在しています。
そのため、AIは日本語のテキストをより細かい単位で分割して処理する傾向があります。
結果として、同じ意味の文章を処理する場合、英語よりも日本語のほうが使用するトークン数が多くなります。
複数の言語でAIを利用する際は、言語ごとのトークン消費量の違いを考慮して入力文章を調整する必要があります。

トークン数はAIの利用料金にどのように関係していますか?

多くのAIサービスやAPIでは、処理したトークン数に基づいて利用料金が計算される従量課金制が採用されています。
ユーザーが入力したプロンプトのトークン数と、AIが生成した回答のトークン数を合計し、その総量に対して費用が発生します。
入力時と出力時で1トークンあたりの単価が異なる料金体系を設定しているサービスも存在します。
不要な情報を含めずに入力文章を短くまとめ、生成される回答の長さを制限することで、消費するトークン数を減らすことができます。
継続的にAIシステムを運用する環境では、トークン数を削減するためのプロンプトの工夫がコスト管理に直結します。

LLMO関連用語一覧

概念・戦略

AIが情報を集約して回答する時代の、新しいマーケティングの考え方です。

プラットフォーム

現在、LLMOの対象となる主要なサービス群です。

主要プラットフォーム

新興・特化型

Google関連

仕組み・基盤技術

AIが情報を理解し、回答を生成する仕組みと基盤となる技術です。

技術的な設定

AIクローラーに対する指示や情報の渡し方に関する項目です。

測定指標・効果の可視化

参考文献

内閣府,大規模言語モデルの現状と今後,https://www.cao.go.jp/consumer/kabusoshiki/digital_technology/doc/007_240910_shiryou1.pdf,(アクセス日:2025.3.19)

加藤善夫・田良島周平,最大トークン数を考慮した大規模言語モデルの文法制約つき文章生成手法,2025,人工知能学会全国大会論文集第39回,3G6-GS-6-01

新エネルギー・産業技術総合開発機構(NEDO),オープンかつ日本語に強いGPT-3級大規模言語モデルの構築・事業成果概要,https://www.nedo.go.jp/content/800021444.pdf,(アクセス日:2025.3.19)

文化庁,大規模言語モデルと言語資源,https://www.bunka.go.jp/seisaku/bunkashingikai/kokugo/gengo/gengo_03/pdf/94116101_02.pdf,(アクセス日:2025.3.19)

LLMO(GEO/AIO)無料診断実施中!
  • 独自開発のLLMO分析ツールを活用
  • 国内他社にはできない詳細なAI可視性(どれだけAIに言及・推奨・引用されているか)分析が可能
  • 現状のLLMO対策の課題と、優先的に取り組むべき施策がまるわかり

現在、AI検索時代への対応やLLMO対策について、お考えでしたらぜひ弊社のLLMO無料診断をご活用ください。独自開発のLLMO分析ツールを活用し詳細な分析を実施。国内企業では現状不可能な高度なAI可視性分析が可能です。主要なAI(ChatGPT, Google Ai Overviews等)における競合比較や現状のLLMO対策の課題と、優先的に取り組むべき施策の可視化をいたします。ぜひ下記よりお気軽にお問い合わせください。

お問い合わせはこちら
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

渡邉志明のアバター 渡邉志明 代表取締役

【経歴・実績】
2019年早稲田大学卒。映像・広告スタートアップや大型求人ポータルサイト運営会社のSEO責任者を経て、これまで200社以上のSEO支援に加え、最新のLLMO(大規模言語モデル最適化)支援においても20社以上の実績を保有。自社独自のLLMOツール開発も手掛ける。

【専門領域】
BtoBサイト、ローカルSEO、メディア型・データベース型サイトのグロースを専門とし、成果創出を軸とした本質的な支援と圧倒的な行動量でのコミットを信条とする。AI時代の検索体験において、技術とコンテンツの両面から最適解を導き出すエキスパート。