Liquid AI、日本語特化の小規模言語・音声モデルLFM2.5を公開

MIT発のスタートアップLiquid AIと日本法人のLiquid AI株式会社が、エッジデバイス向けの新モデル「LFM2.5-1.2B-JP-202606」と「LFM2.5-Audio-1.5B-JP」を公開しました。次世代のオンデバイスAIとして、自動車・製造・ロボティクスなどの産業領域に加え、金融・公共、スマートデバイス分野まで、日本市場の幅広い領域でAIエージェントの実用化を支援するものです。本記事では、2モデルの特徴やモデルファミリーの構成を整理して紹介します。

2つの新モデルを公開

マサチューセッツ工科大学発のスタートアップLiquid AI, Inc.(Co-founder & CEO:Ramin Hasani、本社:米国マサチューセッツ州ケンブリッジ)、および日本法人のLiquid AI株式会社は、エッジデバイスへのデプロイ向けの新モデル「LFM2.5-1.2B-JP-202606」と「LFM2.5-Audio-1.5B-JP」を公開しました。これにより、自動車・製造・ロボティクスといった産業領域に加え、金融・公共、スマートデバイス分野など、日本市場の幅広い領域でオンデバイスAIエージェントの実用化を支援します。

日本語言語モデル LFM2.5-1.2B-JP-202606

LFM2.5-1.2B-JP-202606は、日本語知識、指示追従、数学、コーディング、ツール使用を含む幅広い能力において、同規模モデルと比較して最高水準の性能を実現しています。エージェント型ワークフロー、ツール使用、構造化出力、RAG、日英バイリンガルアシスタント、オンデバイスのパーソナルアシスタントでの利用が推奨されています。

日本語音声モデル LFM2.5-Audio-1.5B-JP

LFM2.5-Audio-1.5B-JPは、エンドツーエンドのマルチモーダルな音声・テキスト言語モデルであり、独立したASR(自動音声認識)やTTS(音声合成)のコンポーネントを必要としません。低遅延とリアルタイムな会話を念頭に設計され、わずか15億(1.5B)パラメータでありながら、シームレスな日本語の対話インタラクションを可能にし、より大規模なモデルに匹敵する能力を実現しているとされます。

LFM2.5-1.2Bモデルファミリーの構成

本モデルファミリーは、ベースモデル、指示追従モデル(日本語対応モデルを含む)、推論モデル、視覚言語モデル(構造化出力対応モデルを含む)、および音声言語モデル(日本語対応モデルを含む)を取りそろえています。GGUF、ONNX、MLXに対応しており、幅広い実行環境への展開が可能です。詳細はHugging Faceで公開されています。

また同規模のモデルと比べてメモリ使用量を抑え、CPU上で高速な推論性能を実現しています。加えて、AMD、Qualcomm、Nexa AIと提携し、LFM2.5ファミリーをNPU向けに展開しています。

提供形態と問い合わせ

本モデルファミリーは、LFM Open License v1.0のもとオープンウェイトとして提供され、Hugging Faceで利用可能です。用途に応じてモデルを選択し、端末上での推論実装や業務ワークフローへの組み込みを進められます。エンタープライズ向けソリューションおよびエッジ環境への導入については、sales@liquid.ai が問い合わせ先となっています。

Liquid AIについて

Liquid AIは、第一原理に基づくアプローチと自社開発の基盤モデルを活用し、プライバシー、性能、そして各業界・領域に特化したニーズを重視した次世代AIを提供しています。ハードウェア、推論、具体的なユースケースを統合したソリューションを構築することで、効率的で持続可能、かつスケーラブルなAI活用社会の実現を目指しています。

参照元:https://prtimes.jp/main/html/rd/p/000000006.000175118.html