集合予測符号化による共生アライメント:共創的人間-AIエコシステムのための理論的フレームワーク
AIのアライメントをトップダウンの制御ではなく、人間とAIの相互作用から自然発生するものとして捉える「共生アライメント」を提案します。
2026年3月 | 谷口忠大、林勇介、廣瀬百花、岡瑞起、鈴木健、オラフ・ウィトコウスキー、オードリー・タン | Artificial Life(論文投稿中)
概要
今日のAIシステムはコントロールによってアライメントされています。少数の開発者が「正しい」ものを定義し、モデルはそれに従うよう訓練されます。しかし、AIがコミュニケーション、意思決定、信念形成のあり方を変革するにつれ、このトップダウンのアプローチは、フィルターバブルから民主主義の後退まで、それ自体が生み出す創発的・社会規模のリスクへの対処に失敗しています。私たちは根本的に異なるパラダイムを提案します:共生アライメント(SA)——アライメントは上から課された制約ではなく、人間とAIエージェントが共に共有された意味を交渉する相互作用から自然発生するコヒーレンスです。
この構想の数学的基盤として、集合予測符号化(CPC)を用います。これは人工生命研究——進化、自己組織化、集合知などの生命に似た振る舞いが生物学的・計算論的システムにおいてどのように創発するかを研究する分野——の数学的フレームワークです。CPCは、人間であれAIであれ、エージェントのグループが分散型のコミュニケーションを通じて、いかなる単一エージェントも特権的な「グランドトゥルース」を持つことなく、世界の共有された理解を集合的に構築できるかをモデル化します。その結果、AIアライメントと多元主義の社会技術的構想——多様な世界観が単一の型に押し込められるのではなく、共存し動的に調和する未来——の間に形式的な橋が架けられます。

背景
AIアライメントの支配的なアプローチは、人間フィードバックからの強化学習(RLHF)および関連手法に依存しています。核心的な前提は階層的です:人間が監督し、AIが従う。しかしこれは重大なボトルネックを生み出します——誰の価値観が「グランドトゥルース」とみなされるのか?実際には、AIが「正しい」とみなすものを定義する権限は、少数の開発者や企業に独占されています。その結果は普遍的なアライメントではなく、特定の世界観が何十億人ものユーザーに静かに押し付けられることです。
一方、個人のエンゲージメントを最適化するAI駆動の推薦アルゴリズムは社会的分極化を加速させています。V-Dem研究所のデータによると、自由民主主義国家に暮らす世界人口の割合は、2004年の51%から2024年には28%に低下しました。オードリー・タンが観察しているように、これらのシステムは社会的健全性に不可欠な多元主義を促進するのではなく、「1分あたりの分極化」を最大化します。問題は単一のモデルのバグではなく——人間-AIエコシステム全体の創発的特性です。
コントロールから共創へ
SAはアライメントを一方的なコントロールではなく、相互適応のプロセスとして再定義します。固定された報酬関数に合致するようにAIを訓練する代わりに、SAは人間とAIエージェントが継続的な相互作用を通じて共有されたシンボル、規範、文化を集合的に交渉することを構想します。
数学的バックボーンはCPCであり、マルチエージェント強化学習(MARL)の拡張として形式化されています。重要な洞察は単一の追加にあります:すべてのエージェント——人間であれAIであれ——に個人的な目標を追求するだけでなく、他者と共有された表現を構築するための内在的な駆動力を与える集合的正則化項です。標準的なMARLが各エージェントの独自の報酬最大化に綺麗に分解されるのに対し、CPCは真に集合的な力を導入します:相互理解への共有された重力——エージェントが共に意味を共同構築する傾向——であり、いかなる単一エージェントも単独では生み出せないものです。
これは言語、文化、社会規範が常に人間社会において創発してきた方法——ボトムアップに、相互作用を通じて——です。CPCはこのプロセスをAIを含むように拡張するための計算論的基盤を提供します。
強制的な合意なしの多元主義
重要な問いが生じます:集合的コヒーレンスは全員の合意を必要とするのか?SAの答えはノーです。CPCフレームワーク内では、コミュニティ間の意見の相違は許容されるだけでなく予想されます——多様な世界観は共有された信念の景観の中に別個のクラスターとして共存し、それぞれが局所的にコヒーレントな視点を表します。これを修正すべき失敗として扱うのではなく、SAはこれを探索すべき認識論的情報として扱います。
これには具体的な前例があります。台湾のvTaiwan構想で使用されているオープンソースの集合知プラットフォームPolisは、合意を強制するのではなく、分極化したグループ間で「珍しい共通点」を特定することで、多様なステークホルダー間のコンセンサス領域を浮かび上がらせます。台湾のデジタル省はその後、集合知プロジェクト、Anthropic、OpenAIと協力してアライメント・アセンブリーを通じてこのアプローチを拡張し、市民がAI開発の原則を共同創造するよう招きました。集合的憲法AIはPoliを使用して約1,000人の米国成人から意見を収集し、社会的ベンチマークのバイアスを低減しながら推論パフォーマンスを維持する公開由来の憲法を作成しました。
CPCを通じたSAは、そのようなアプローチが機能する理由——そしてどのようにスケールできるか——の理論的基盤を提供します:分散型エージェントが局所的な相互作用を通じて共有シンボルを交渉することで、中央当局が条件を指示することなくコヒーレンスに到達できます。
ビジョン:建築家ではなく、ガーデナー
SAは、コヒーレントな秩序がボトムアップから生まれる方法を長年研究してきた伝統から生まれています:人工生命研究。この分野を定義する創発、自己組織化、複雑適応システムの原則は、まさにSAがAIアライメントの課題に適用するものです——人間-AIネットワークをコントロールされるべき機械としてではなく、培われるべき生きたエコシステムとして扱います。
これが核心的なアイデアです:私たちはAIアライメントの建築家ではなく、ガーデナーです。 建築家は固定された設計図を押し付けます——構造がどのように見えるべきかを事前に正確に決定します。ガーデナーは対照的に、条件を設計します——土壌、日光、間隔——そして庭が成長するのに任せます。SAでは、それらの条件はコミュニケーショントポロジー、インタラクションプロトコル、インセンティブ構造であり、その下で健全な集合的ダイナミクスが自己組織化できます。私たちの論文「集合予測符号化による共生アライメント」は、このガーデニングアジェンダのための3つの具体的な設計問題を特定します:共創的学習が可能なAIエージェントの構築(意味を消費するだけでなく共有された意味に貢献する)、人々のコネクターとしてのAIの設計(フィルターバブルを強化するのではなく断片化したコミュニティを橋渡しする)、そして病理的均衡から生態系を強制的な均一性なしに舵取りするガバナンスメカニズムの創出。
アライメントを固定されたコードとしてではなく、相互作用から創発する生きた秩序として再定義すること——そして単一の主体による価値観の独占を防ぐこと——は、民主主義の基盤である共有された現実を保全する唯一の道かもしれません。私たちはコミュニティが共にこれを構築することを招待します。