Claude 3.5のアップデートとComputer use機能

Robotics

はじめに

Anthropicは2024年10月23日、フラッグシップAIモデル「Claude 3.5 Sonnet」の大幅なアップグレードと、新モデル「Claude 3.5 Haiku」の発表を行いました。特に注目すべきは、業界初となる「Computer use」機能のパブリックベータ版の導入です。

Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku
A refreshed, more powerful Claude 3.5 Sonnet, Claude 3.5 Haiku, and a new experimental AI capability: computer use.

Claude 3.5 Sonnetのアップデート

アップデートされたClaude 3.5 Sonnetは、特にコーディング分野で大きな進歩を遂げています。

業界標準のベンチマーク「SWE-bench Verified」では、性能が33.4%から49.0%に向上し、OpenAIのモデルを含む他の公開モデルを上回る結果を示しました。

自身のアカウントでも確認してみましたが、Claude 3.5 Sonnet(New)となっていました。

claude 3.5 Sonnet new

「Computer use」機能

今回のアップデートで最も画期的なのが、「Computer use」機能の導入です。この機能により、

  • 画面を見る
  • カーソルを動かす
  • ボタンをクリックする
  • テキストを入力する

といった従来RPAで構築していた操作が自然言語で実行可能になります。

ただし、現在開発途中であり、スクロール、ドラッグ、ズームなど、人間にとっては苦もなく実行できる操作が現在の課題となっており、開発者にはリスクの低いタスクから探索を始めることを推奨しています。

Computer use (beta) - Anthropic

新モデル:Claude 3.5 Haiku

新たに発表されたClaude 3.5 Haikuは、前世代のClaude 3 Haikuと同じコストと速度を維持しながら、多くの評価指標で前世代の最上位モデルであるClaude 3 Opusの性能を上回ります。

特にコーディングタスクでの性能が高く、SWE-bench Verifiedで40.6%のスコアを達成しています。

利用開始時期

  • Claude 3.5 Sonnetの新バージョン:即日利用可能
  • Computer use:Anthropic API、Amazon Bedrock、Google Cloud Vertex AIで即日利用可能
  • Claude 3.5 Haiku:10月後半にリリース予定(当初はテキストのみ、画像入力は後日追加)

安全性への配慮

Anthropicは、US AI Safety InstituteとUK AI Safety Instituteによる事前テストを実施し、新機能の安全性を確認しています。特にコンピュータ使用機能については、スパムや誤情報への悪用を防ぐための新しい分類器を開発するなど、セキュリティ対策を強化しています。

まとめ

今回のアップデートは、AIの実用性を大きく前進させる画期的なものと言えます。特にComputer use機能の導入は、これまでのRPA開発がさらに転換する可能性があり、現時点ではまだ実験的な段階ですが、今後の急速な進化を期待しています!

コメント