医彩―フロントランナーと語るヘルスケアビジネスの最前線

「AI×タンパク質」がもたらす、次なるブレークスルー【前編】 タンパク質の文法解明が導く、創薬の新世界

  • 2025-09-03

日々、「できること」のレベルを急速に高度化し、対応領域を拡大しているAI。その利用により、医薬品開発の現場が大きく変わり始めています。AIを利用した高機能タンパク質の開発などを手掛ける株式会社レボルカ 代表取締役社長の浜松典郎氏をお迎えし、「AI×タンパク質」によって変革が進む創薬の世界を俯瞰するとともに、その将来に迫ります。前編では、AIが創薬の現場に与えたインパクトを共有し、創薬の未来を見通します。

(左から)岩瀬 歩氏、浜松 典郎氏、河 成鎭、西田 雄太

(左から)岩瀬 歩氏、浜松 典郎氏、河 成鎭、西田 雄太

参加者

浜松 典郎氏
株式会社レボルカ 代表取締役社長CEO

河 成鎭
PwCアドバイザリー合同会社 パートナー

西田 雄太
PwCアドバイザリー合同会社 ディレクター

低分子から高分子へ。創薬の現場で進むAI利用

株式会社レボルカ 代表取締役社長CEO 浜松 典郎氏

株式会社レボルカ 代表取締役社長CEO 浜松 典郎氏

西田:
AI技術の創薬プロセスへの活用により、医薬品の開発スピード向上や開発費の削減が期待されるなど、いわゆるAI創薬の可能性が様々な領域でハイライトされています。一例として、従来プロセスに比べて開発期間が4年程度短縮でき、1品目あたりの開発費も約600億円程度削減できるといった試算が厚生労働省からも公表されています。

これまでは、主に化学合成で作られる低分子医薬品向けのAI創薬がテーマとなっていましたが、本日は近年注目を集めているバイオ医薬品を中心とした高分子医薬品向けのAI創薬にフォーカスを当てて議論を進めていきたいと考えています。

創薬におけるAI活用の変遷について、浜松さんのご経験なども交えながら説明していただけますでしょうか。

浜松:
私は前職で大手の製薬企業に勤務し、ボストン(米国)で医薬品の研究開発に従事していました。低分子医薬品のAIについては、その製薬会社に在籍していた2020年前後の時点で、すでにコモディティ化が進んでいました。

低分子医薬品の場合、バイオロジスト(生物学研究者)が行った候補化合物の生物学的評価データを基に、ケミスト(化学研究者)が、次の候補化合物をデザインします。ここでケミストのアシスタント的な役割でAIが利用されていたというのが、私が横で見ていた姿です。その企業が蓄積している化合物の構造と生物学的な活性の紐付けデータ(Structure-Activity relationship: SAR)をAIに学習させて、AIにも構造分析をさせて、「これを試してみたらどうか」といった提案をさせるわけです。

河:
ケミストリーとAIの2本柱で、次のコンパウンドを探していくということですね。

浜松氏:
はい。低分子は構造がシンプルですから、ロジカルに考えやすいです。また、AIは分子軌道計算のようなことができ、デジタルとの相性も良いため、低分子医薬品の開発ではAIが早くから導入されてきました。

一方、当時、高分子医薬品の開発では、依然として研究者がトライ・アンド・エラーを繰り返して候補物質を探していました。タンパク質は構造が複雑な高分子で、当時のAIでは分子軌道計算のようなことができなかったからです。それが近年になって、タンパク質のアミノ酸配列からその立体構造を高い精度で予測するAIプログラムが利用されるようになり、タンパク質の構造予測もある程度可能となっています。

西田:
本当にここ数年の話ですよね。タンパク質の立体構造解析と予測ができるAIプログラムが2021年に無料で一般公開され、高分子医薬品の創薬プラットフォームとして使われるようになり、創薬の世界に大きなインパクトを与えました。開発の中心的な貢献者であるデミス・ハサビス氏とジョン・ジャンパー氏は、「タンパク質の構造予測」の業績によって、2024年のノーベル化学賞を受賞しています。

変わる、予測の手法。「AIがライブラリーの外に出ていく」

PwCアドバイザリー合同会社 パートナー 河 成鎭

PwCアドバイザリー合同会社 パートナー 河 成鎭

河:
AI技術を用いたタンパク質構造予測の普及は、医薬品開発に具体的にどのようなインパクトを及ぼすとお考えでしょうか?例えば、高分子医薬品の主役である抗体医薬(人間の体内に存在する抗体というタンパク質を人工的に作り出し、利用する医薬品)においては、標的タンパク質とのアフィニティを上げることは、有効性・安全性においてクリティカルに重要ですので、この分野への応用はわかりやすい例とは思いますが。

浜松氏:
目の前にある化合物ライブラリーをスクリーニングし、いいものがあれば、創薬の標的分子に対して活性が認められる「ヒット化合物」として取る。それが不十分であれば、研究者がデリバティブをつくって再びスクリーニングをする——クラシカルな方法は、この繰り返しでした。ライブラリーの中にヒットがないと当たりに到達できませんので、20年ほど前の医薬品業界は、ライブラリーの充実とスクリーニングの高速化に力を入れていました。

それが、AIを使うと、ライブラリーの中に物理的なヒットがなくても、ごく一部の情報から学んで予測をし、ライブラリーの外側に出ていきます。ライブラリーの中にないものを予測して、「こちらの方がいいのではありませんか」と提案するわけです。それがもしヒットだとすると、クラシカルな方法とは別物の世界になってきます。精度が上がるほど、スクリーニングに必要なエフォートは劇的に少なくなりますので。抗体医薬ではこの領域での競争が激化していて、米国では各プレーヤーが、高精度の予測機開発にしのぎを削っています。

西田:
これらの予測機は、今後どのようなレベルの精度や機能を目指していくのでしょうか。

浜松氏:
究極的には、「100%インシリコ(実験や観察を行う代わりに、計算によって生物学的な現象やプロセスを研究する手法)」、つまりすべてをデジタルで終わらせることを目指しています。欲しい抗体のリクエストをすると、「こういう配列をテストしてみたらどうですか」といった提案が出てくる世界です。

問われるデータの質。鍵は、ポジティブでランダムなデータ

PwCアドバイザリー合同会社 ディレクター 西田 雄太

PwCアドバイザリー合同会社 ディレクター 西田 雄太

西田:
ライブラリの中にないものまでを予測・提案するタンパク質の構造予測技術について話題にあがりましたが、今後より高い精度を目指していく際に、ライブラリーに入っているデータの質はどの程度問われるものでしょうか。予測の結果としてターゲットにつながっていくような特徴的なデータ、つまり「良質なデータ」がライブラリーに数多く含まれていないと、予測精度に影響を与えるのではないかと思います。

浜松氏:
データの精度が低いと、予測結果にエラーがたくさん入ってきますので、AIに学ばせるデータの精度が非常に大事なのは間違いありません。

レボルカでは、進化分子工学とAIを融合させて、高い精度の予測を行うタンパク質の探索技術を開発しています。

この技術で必要な実験データは約100個とごく少数です。新たに学習させるデータが少ないと、予測精度を上げていく時に、十分に注意を向けることができるメリットがあります。これが、例えばミリオン、ビリオン単位のデータが必要になると、データのキュレーション(整理や編集)が困難で、粗いデータを使わざるを得なくなり、導き出された予測が正しいかどうかを検証する必要が出てきます。

西田:
学習対象とするデータの検討は、AI活用全般に共通する難しさと感じます。

浜松氏:
検証が容易なものはいいのです。例えば、対話型生成AIに質問を投げて、返ってきた答えが正しいかどうかは、人間が見ておおむね判断できます。しかし、タンパク質の場合、予測結果が正しいかどうかは、実際にテストをしなければならず、大変な労力がかかります。データは多ければいいのは間違いありませんが、「クオリティーが高いデータ」という条件が付きます。

西田:
データのバイアス(偏り)についてはどうでしょうか。「ある程度正しいかもしれないけれど、研究をする側の考え方に沿ったデータ」ばかりに片寄ると、予測のベクトルが一方に引っ張られるのではないでしょうか。特に人間による判断が難しい場合、何を軸にして質の高いデータを定義するかは難しい問題のように感じます。

浜松氏:
本当に難しいと思います。いいデータを作らないといいAIができない。「じゃあ、そのいいデータって、どんなデータですか?」といった問題が必ず出てきます。

西田:
先ほど、100個レベルの少数な実験データをAIに学習させる技術について解説頂きましたが、読み込ませるデータはどのような基準で選別されているのでしょうか。

浜松氏:
2つの点を重視しています。まず、少数でもいいので、ポジティブなデータが入っていること。ポジティブのデータがゼロだと、予測は自分たちが求める方向に行きません。もう1つはダイバーシティです。ランダムに分散していることですね。

データの質に関連した話をしますと、実は私たちは、コンピューティングだけで薬を作るのは、少なくともこの先10年、20年は難しいとみています。その間はどうするかと言うと、何とかしたいタンパク質から取った直接のデータ(標的由来データ)が必要だろうと。元になるモデルの解像度が低く、これだけでは精度が上がらなくても、少しデータを足してやることで精度が一気に上がります。弊社の場合は、そのように少しデータを加える作業を行うからこそ、必要なデータが100個レベルで済むわけです。海外の学会でも、「データをいじるだけではまだ精度が上がらないよね」「標的由来データがいるよね」と参加者で議論し始めています。

次の革新を生む、言語モデルを活用した文法解明

河:
創薬のプロセスにおいて、AIはリード化合物を効果的に探索するというだけではなく、その後ろのプロセス、例えば体内動態や安定性を試すところでも使われ始めています。となると、体内動態や安全性に関するAIの解析結果がリード化合物の探索にフィードバックされAIの解析同士がつながることにより、よりよいリード化合物のデザインが可能となる、といったことも想像するのですが。

浜松氏:
あり得る話だと思います。あるタンパク質の配列に対して紐付いているデータが蓄積されれば、そこから学習ができますので。安定性というデータと、体内動態のデータといった異なる領域でも、1つの配列に対して紐付いているものはリンク付けができます。そこから学んでいって、どこを攻めて変えていけば、より良いものが取れる可能性があるのかといった予測につながっていくはずです。

河:
となると、M&Aか自社によるケイパビリティー獲得かは別として、創薬プロセスにおける後ろのバリューチェーンを持つことは、貴社のコアな技術をとがらせていく上で意味がある動きになる気がしますがいかがでしょうか。

浜松氏:
ご指摘のとおり、自分たちのAIにより高いバリューを付けることが可能になってくるでしょう。レボルカが研究をしているタンパク質×AIの世界に、言語モデルという分野があります。対話型生成AIも言語モデルの一つです。タンパク質はアミノ酸の鎖ですが、アミノ酸はアルファベットで書くことができますので、並びを見ると、アルファベットが並んだ「単語」かもしれないと感じます。例えばLと何らかの文字がつながって、折り畳まれると生物活性を出します。逆に言うと、「その生物活性を出すためには、このアルファベットの並びが重要で、その文法が分かれば、こういう生物活性にはどういう配列がいいのかが分かるね」と。

河:
文法ですか。面白い表現ですね。

浜松氏:
この「タンパク質言語モデル」の文法を誰がいち早く紐解くか。英語やフランス語があるのと同じで、タンパク質の分野によって違う文法がたくさんあるのでしょうけれど、その文法を理解すれば機能を予測できるかもしれない。まだ発展途上ですが、タンパク質の言語モデルは世界で研究が進んでいます。勝者がどんな形で出てくるのか。タンパク質の立体構造解析と予測ができるAIプログラムの出現に匹敵するインパクトがあるはずです。

西田:
非常に興味深いお話です。

浜松氏:
レボルカはその研究に、2023年から取り組んでいます。

河:
研究の中身についてもう少し教えていただけますか。

浜松氏:
タンパク質は、アミノ酸の一次構造である配列と、二次・三次・四次の(立体)構造、そして機能が互いに関連しあっています。すでに海外で開発されたAIプログラムは、このトライアングルのうち、配列と構造の間の関係性についての情報を与えてくれました。となると、次に知りたいのは、配列と機能、あるいは構造と機能の関係性です。レボルカでは言語モデルなどを投入して、配列から機能を予測することに取り組んでいます。

河:
(二次から四次の立体)構造を介さずに、配列からいきなり機能を予測するのですか。

浜松氏:
はい。そこに先ほどお話しした文法があるはずです。チャレンジングな取り組みですので、まだ精度が上がってはきていませんが、工夫してやっているところです。

河:
本当にすごい世界になってきますよね。

浜松氏:
言語モデルを使い始めて計算も大きくなってくると、今度は量子コンピューティングのパワーが必要になってきます。量子コンピューティングは、膨大な組み合わせの中から最適な組み合わせを探すことが得意ですので。

後編はこちら

主要メンバー

河 成鎭

パートナー, PwCアドバイザリー合同会社

Email

西田 雄太

ディレクター, PwCアドバイザリー合同会社

Email

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

本ページに関するお問い合わせ