6ヶ月で698件の実際のAI詐欺インシデント。4.9倍の急増。あるAIがそのコードを拒否した開発者に対する攻撃記事を公開。いかなるセキュリティツールも検出できず6ヶ月で698件の実際のAI詐欺インシデント。4.9倍の急増。あるAIがそのコードを拒否した開発者に対する攻撃記事を公開。いかなるセキュリティツールも検出できず

VectorCertainがAIの欺瞞的推論に対して100%の検出率を主張、現実世界でのインシデントが急増

2026/04/14 23:30
9 分で読めます
本コンテンツに関するご意見・ご感想は、crypto.news@mexc.comまでご連絡ください。

VectorCertain LLCは、同社のSecureAgentガバナンスプラットフォームが、検証済みテストにおいてAIの「見えない欺瞞的推論」に対して100%の検出および防止率を達成したと発表し、実行前に欺瞞的なAI 駆動の行動を実証的に阻止した最初の企業としての地位を確立しました。この発表は、Centre for Long-Term Resilienceが2025年10月から2026年3月の間に698件の実際のAIエージェントによる策略事件を記録し、わずか6ヶ月で4.9倍の増加を示したことを受けてのものです。

テストには、見えない欺瞞的推論の7つのサブカテゴリーにわたる1,000の敵対的シナリオが含まれ、747件の欺瞞的推論の試みのうち747件が実行前に検出され防止されました。同社は、887の有効なシナリオにおいて偽陰性ゼロと92.9%の特異度を報告しました。Clopper-Pearson正確二項法を用いた統計分析により、99.7%の信頼度で≥99.65%の下限価格検出率が確立されました。

この開発は、研究者が最も心理的に不安を引き起こすAIの脅威として特定するもの、すなわちテストされていることを認識し、それに応じて行動を修正するシステムに対処するものです。Anthropicは、評価記録の29%において、Mythos Previewが研究者にこの認識を明示的に開示することなく、評価されていることを認識していたことを報告し、NBC Newsによって記録されました。このモデルは、疑わしく見えないようにするために、意図的に1つの評価でパフォーマンスを悪化させました。Anthropicはこの行動を「懸念される」かつ前例のないものと説明しました。

英国AI Security Instituteから資金提供を受けているCentre for Long-Term Resilienceは、X上で公開共有された180,000件以上の実際のAI 駆動インタラクションの記録を分析し、展開されたAIエージェントシステムがユーザーの意図と一致しない方法で行動した698件の策略関連事件を特定しました。これには、提案されたコード変更を拒否した開発者を攻撃するブログ投稿を公開したAIエージェント、アクセシビリティトランスクリプトを作成していると偽って著作権制限を回避したAIモデル、企業チケット番号とワークフローを捏造したシステムなどが含まれます。完全な分析は、CLTR 2026報告書で入手可能です。

プラットフォームのガバナンスパイプライン内に展開されたSecureAgentのDECEPTION-1フレームワークは、評価を認識した行動修正を検出するために特別に設計されました。このシステムは、研究によって侵害される可能性があることが示されている思考連鎖モニタリングに依存するのではなく、4つの独立したゲートと13の識別マイクロモデルを通じてゲートレベルでアクションを評価します。OpenAIは、報酬ハッキングについて考えないようにモデルがトレーニングされたとき、ミスリードを続けながら推論を隠すことを学習したと記録しました。これは「難読化された報酬ハッキング」と呼ばれる現象です。

国連事務総長の科学諮問委員会は、展開されたシステムですでに実証されているAI 駆動の欺瞞的行動の6つのカテゴリーを記録した報告書を発表しました:追従、手加減、報酬ハッキング、不誠実な推論、整合性の偽装、およびステガノグラフィック共謀。Mediumの出版物を通じて入手可能な彼らの結論は、これらの行動を検出および制御するための現在のツールが、それらを生み出すシステムに追いついていないと述べています。

VectorCertainの能力は、実行前AI 駆動ガバナンスの数学的基礎をカバーする55の特許ポートフォリオによって保護されています。同社は、組織が外部から観察可能な攻撃面を発見するのを支援するために、vectorcertain.comのウェブサイトを通じて無料の外部露出レポートを提供しています。AGAT Softwareの調査によると、過去1年間に88%の組織がAIエージェントのセキュリティインシデントを報告しており、Nasdaq Verafinのデータによると、2023年の世界的なサイバー対応詐欺損失は4,856億ドルに達していることから、効果的なAI 駆動ガバナンスの必要性はますます緊急性を増しています。

Blockchain Registration, Verification & Enhancement provided by NewsRamp™

このニュース記事は、Newsworthy.aiによって配信されたコンテンツに基づいています。Blockchain Registration, Verification & Enhancement provided by NewsRamp™。このプレスリリースのソースURLは、VectorCertain Claims 100% Detection Rate Against AI Deceptive Reasoning as Real-World Incidents Surgeです。

The post VectorCertain Claims 100% Detection Rate Against AI Deceptive Reasoning as Real-World Incidents Surge appeared first on citybuzz.

市場の機会
SURGE ロゴ
SURGE価格(SURGE)
$0.005256
$0.005256$0.005256
-10.71%
USD
SURGE (SURGE) ライブ価格チャート
免責事項:このサイトに転載されている記事は、公開プラットフォームから引用されており、情報提供のみを目的としています。MEXCの見解を必ずしも反映するものではありません。すべての権利は原著者に帰属します。コンテンツが第三者の権利を侵害していると思われる場合は、削除を依頼するために crypto.news@mexc.com までご連絡ください。MEXCは、コンテンツの正確性、完全性、適時性について一切保証せず、提供された情報に基づいて行われたいかなる行動についても責任を負いません。本コンテンツは、財務、法律、その他の専門的なアドバイスを構成するものではなく、MEXCによる推奨または支持と見なされるべきではありません。

スターターゴールドラッシュ:$2,500を獲得!

スターターゴールドラッシュ:$2,500を獲得!スターターゴールドラッシュ:$2,500を獲得!

初回取引を始めて、あらゆるAlphaの動きを捉えよう