Shopping Cart
Total:

$0.00

Items:

0

Your cart is empty
Keep Shopping

AnthropicがClaude Opus 4.6を発表、コーディングだけでなく財務処理や文書作成の性能も向上&最大100万トークンのコンテキストウィンドウに対応 – GIGAZINE



AnthropicがClaude Opus 4.6を発表、コーディングだけでなく財務処理や文書作成の性能も向上&最大100万トークンのコンテキストウィンドウに対応 - GIGAZINE


AI


Anthropic は、同社の最も強力な AI モデルへの直接アップグレードになります。作業4.6を閉じる同社は今回の新モデルの投入にあたり、単に次期モデルとしてではなく、開発者向けのClaude Codeに加え、非技術職も含めたビジネス全体に浸透する製品群とセットでOpus 4.6を投入する動きを見せている。

クロード Opus 4.6 \ Anthropic
https://www.anthropic.com/news/claude-opus-4-6

システムカード:クロード Opus 4.6
(PDFファイル)https://www-cdn.anthropic.com/0dd865075ad3132672ee0ab40b05a53f14cf5288.pdf

Claude Opus 4.6 による金融の進歩 |クロード
https://claude.com/blog/opus-4-6-finance

並列クロードのチームで C コンパイラを構築する \ Anthropic
https://www.anthropic.com/engineering/building-c-compiler

Claude Opus 4.6は、前世代モデルから長いタスクを途中で中断せずに進める方向で強化されたモデルで、より綿密な計画が可能となり、エージェント的な長期タスクをより長く維持できるようになり、大規模なコードベースでも安定して実行しやすくなった。さらに、Anthropic は、コードレビューとデバッグが改善され、自身の間違いを見つけて修正する能力が向上したと説明しています。

さらに、コーディングだけでなく、財務分析、調査、文書、スプレッドシート、プレゼンテーション作成などの日常業務のパフォーマンスも向上し、最初の出力からより良い結果を生み出しやすくなりました。

クロードの日常業務 – YouTube


また、Opus 4.6 では、Opus クラス モデルで初めて 100 万トークンのコンテキスト ウィンドウがベータ版として導入され、大規模なコードベースと大規模なドキュメント セットを処理する能力が劇的に向上しました。さらに、タスクの難易度に応じて推論の深さを調整する適応的思考機能を追加することで、複雑な多段階のタスクでも人による修正が少なく、初回から完成度の高い成果物を出力できるようになりました。

Anthropic は、Opus 4.6 がパフォーマンス評価において業界をリードする数々の記録を打ち立てたと主張しています。経済的に価値のある知識作業を実行する能力を測定するためのベンチマーク。GDPval-AA』は、前世代モデルの1416 Eloから190ポイントアップの1606 Eloという驚異的なスコアを達成しました。


また、エージェントのコーディング能力も測定します。ターミナルベンチ 2.0最高得点を記録したほか、人類最後の試験しかし、他のフロンティアモデルよりも優れています。 Anthropic は、これらの結果は知識だけでなく、現実世界の複雑なワークフローを完了するための実践的な能力も大幅に向上していることを示していると主張しました。

金融分野に特化していることも、Opus 4.6 の大きな特徴です。

金融のためのクロード Opus 4.6 – YouTube


約50の投資・財務分析ユースケースをカバーするAnthropic独自の評価指標であるReal-World Financeでは、正答率64.1%を達成し、前モデルの58.4%を上回った。これにより、財務モデルの構築、スライド資料の作成、複雑な契約のレビューなどのタスクをより正確に完了できるようになります。


特にExcelと連携すると、計算モデルが複雑になっても精度を落とさずに長時間集中して業務に取り組むことができ、新たにリサーチプレビューとしてリリースされたPowerPoint機能と組み合わせることで、金融アナリストの業務効率の飛躍的な向上が期待されます。


AIを活用した自律的なソフトウェア開発の可能性を実証するプロジェクトとして、「エージェントチーム」と呼ばれる手法を用いた実験結果が公開された。

クロードのチームによる非同期ソフトウェア開発 – YouTube


Anthropic が 16 個の Opus 4.6 インスタンスを並行して実行し、詳細な指示なしで人間が共同作業できるようにしたところ、Rust 言語を使用して 100,000 行の C コンパイラをゼロから構築することに成功しました。ムービーではこのCコンパイラを使って『DOOM』を実行することに成功しました。


このコンパイラは実際にx86、ARM、RISC-V上でLinux 6.9をビルドできる性能を備えており、約2000セッションをかけて自律的に開発が進められた。この一連の処理に投資されたAPIコストは2万ドル(約300万円)に達しており、将来的にはAIが大規模なコードベースを自律的に保守・管理できるようになる可能性が示唆されています。

Claude Opus 4.6 は現在、ビジネスおよび個人ユーザーに広く利用可能であり、有料の Pro、Max、Team、Enterprise ユーザーもアクセスできます。 APIの料金体系は前世代のOpus 4.5から変更されておらず、100万トークンあたりの手数料はインプットが5ドル(約750円)、アウトプットが25ドル(約3,750円)となっている。

ただし、100万トークンという広大なコンテキストウィンドウを活用した大規模な処理を行う場合、20万トークンを超えるインプットには追加料金が適用され、インプットが10ドル(約1,500円)、アウトプットが37.5ドル(約5,630円)となります。

さらに、Opus 4.6は安全性に関してもAI安全レベル3(ASL-3)の高い基準を維持しており、高度なインテリジェンスと安全な操作を両立しています。

この記事のタイトルとURLをコピーします



Source link

0
Show Comments (0) Hide Comments (0)
0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Recent Posts:
0
Would love your thoughts, please comment.x
()
x