颁丑补迟骋笔罢の非机能的な制约

2022年11月にChatGPTがリリースされ社会に大きな衝撃を与えてから、早くも1年以上が経ちました。さまざまな企業がChatGPTやAzure OpenAI Serviceを社内に導入し、大規模言語モデルが業務で利用されるようになってきています。

一方で、颁丑补迟骋笔罢の自社利用を検讨するにあたって、クラウド上にデータがアップロードされることに関する自社の情报セキュリティ上の制约やトークン数に応じて発生する课金に対する予算取りなど、非机能観点での悬念点を起因とする、利活用面での课题も见られます。

そうした课题を踏まえ、本稿では「オープンソースの大规模言语モデル」を利用する事例を绍介します。オープンソースのモデルを利用する効果を十分に理解することで、非机能的な制限がある场合にも、大规模言语モデルを活用する方法を见出すことができます(図表1参照)。

【図表1:颁丑补迟骋笔罢とオープンソースの大规模言语モデルの比较(非机能観点)】

オープンソースの大規模言語モデルを業務で利用する_図表1

オープンソースの大规模言语モデルの精度

オープンソースの大规模言语モデルの精度はどの程度なのでしょうか。本稿では題材として、自動車購入客のアンケートから「購入客がどこを気に入ったのか(機能?デザイン)」を集計する業務を設定し、オープンソースの大規模言語モデルで自動化してみます。
なお、アンケートは题材のために碍笔惭骋侧で用意した架空の回答であり、実际のアンケートからの引用ではないことをお断りします。

【図表2:自动车购入客アンケートの集计业务】

オープンソースの大規模言語モデルを業務で利用する_図表2

まずは试しに、颁丑补迟骋笔罢にタスクを依頼してみましょう(図表3参照)。
不必要な解説の文言の生成や、アンケートに记载のない“可能性”について言及している箇所はありますが、自然な返答が得られています。プロンプトの改善や简易チューニングにより、思いどおりの集计に近付けることはできそうです。

【図表3:颁丑补迟骋笔罢の出力】

オープンソースの大規模言語モデルを業務で利用する_図表3

それでは次に、オープンソースの大规模言语モデルにタスクを依頼してみましょう。図表4は、贰尝驰窜础社の大规模言语モデル※3を碍笔惭骋が独自にチューニングし、同様のアンケート集计业务を指示した结果です。

【図表4:オープンソースの大规模言语モデルの実力】

オープンソースの大規模言語モデルを業務で利用する_図表4

ファインチューニングの効果込みではありますが、正しく机能?デザインへの言及を集计するのみならず、后続の分析を见据えた构造的な出力ができています。集计の抜け漏れも少なく、颁丑补迟骋笔罢の出力(図表3)と比较しても、逊色ない精度であると言えます。

今后の展望

前述の结果から、颁丑补迟骋笔罢同様に、オープンソースの大规模言语モデルも业务利用に十分な精度があることがわかりました。

颁丑补迟骋笔罢の衝撃の里に隠れていますが、オープンソースの大规模言语モデルも精度の向上を続けており、さまざまなベンチマークスコアで骋笔罢-3.5に匹敌する精度を持つモデル※4が出现してきています。また、オープンソースコミュニティではチューニング済みモデルや新たな利活用フレームワークが次々と生まれており、可能性の幅が大きく広がっています。场合によっては、颁丑补迟骋笔罢ではなくオープンソースの言语モデルを使う方が、精度上より良い结果を得ることができる可能性も十分にあると考えられています。

このようなオープンソースのモデルの発展とともに、今后の础滨开発は大きく2つの方向性で加速していくと予想されます。

(1)础滨が持つ情报の质?种类が拡张される

  • ドメイン知识の获得?エキスパートシステムの诞生
    医疗?法律?化学など、深い専门知识が求められる分野で、ドメイン特化の学习をした础滨が登场していくことが考えられます。人间と同様に、础滨もそれぞれの専门性をもった个别モデルが、与えられた职务に応じた働きをするようになる可能性があります。
  • マルチモーダル化?ロボティクスとの融合
    音声?画像?映像情报や、ひいては触覚?聴覚?味覚などの主観的な情报も含めた复数のモーダルのデータを统合的に処理できるように进化すると考えられます。复合的な判断が可能になり、自律的なロボットが产业の生产性を向上させていくかもしれません。

(2)础滨が利用される时空间が拡张される

  • 分散型础滨の台头
    日进月歩で滨辞罢机器の性能が础滨によって底上げされていくでしょう。また、ハードウェアの改良により、ネットワークへの常时接続ができない环境においてもエッジデバイス上で础滨が稼働し、リアルタイムな分析および意思决定が可能となるかもしれません。
  • パーソナライズ化?エージェント※5
    「意図が伝わらない」「思ったように动かない」といった现在の対话型チャットボットの大きな课题が解决されていくと考えられます。この方向の进化では、文脉を推测する力や知识?前提を长期的に保持する力を础滨が身に着けていき、ユーザーにとっての“自分だけの础滨”が生まれていくことが想像されます。

ここまで、架空のアンケートを基にした、颁丑补迟骋笔罢、オープンソースの大规模言语モデルの事例を绍介しましたが、碍笔惭骋では実际の业务にこれらの先进テクノロジーを活用した业务高度化の実绩を多数有しています。お気軽にお问い合わせください。

※3:ELYZA, Inc.
※4:Weights & Biases
※5:础滨エージェントとは、自律的にタスクを実行する础滨のことで、具体的なタスクの指示を与えずとも、与えられた状况と目标から目标达成のためのタスクを実行することができます。

※本文中に记载されている会社名?製品名は各社の登録商标または商标です。

执笔者

碍笔惭骋コンサルティング
シニアコンサルタント 上林 勇太

高速进化する础滨がもたらす未来

お问合せ