SIP-jmed-llm-2シリーズの公開

研究成果

戦略的イノベーション創造プログラム(SIP)第3期「統合型ヘルスケアシステムの構築における生成AIの活用」テーマ1「安全性・信頼性を持つオープンな医療LLMの開発・社会実装」では、相澤彰子教授を中心としたチームによって安全性・信頼性を持つオープンな日本語医療LLMの開発を行い、2025年4月以降、SIP-jmed-llmシリーズの公開を進めてきました。

このSIP-jmed-llmシリーズは、大規模言語モデル研究開発センター(LLMC)で開発されたオープンかつ日本語に強い大規模言語モデルであるLLM-jp-3シリーズをベースモデルとしています。Webなどから収集された大規模な日英の医療文書を用いて継続事前学習および指示チューニングを施すことにより開発され、現在、8×13Bパラメータのモデルが公開されています。

さらにモデルの公開に合わせて、継続事前学習の一部に用いられた日本語汎用ウェブコーパスも公開しました。

今回公開するリソースの詳細については、以下のリンクよりご確認ください。

公開リソース

チューニング済みモデル

データ

留意事項

  • 本モデルは研究開発段階のプロトタイプであり、実臨床における安全性・有効性の検証は十分に行われていません。
  • 開発者は、本モデルに関し、その正確性、完全性、最新性、および品質など、いかなる保証も行わず、利用者が本モデルを利用したこと、または利用できなかったことにより生じた一切の損害について責任を負いません。
  • 医療行為(診断、治療方針の決定、健康への助言など)に直接適用することは推奨されません。あくまで医療専門家による適切な判断の補助となる情報提供ツールとしての利用可能性を探る研究段階にあります。
  • 本モデルを活用して「具体的な製品」を開発される場合、その製品が医療機器プログラムとして薬機法の規制対象となる可能性があることにご留意ください。
  • プログラム医療機器の該当性に関する相談窓口: https://www.pmda.go.jp/review-services/f2f-pre/strategies/0011.html