GoogleのAIチャットボット「Gemini」が、ついにGitHubとの連携に対応しました——ただし、これは月額20ドルの「Gemini Advanced」プランに加入しているユーザー限定の機能です。水曜日より、Gemini AdvancedユーザーはGitHub上の公開・非公開のコードベースをGeminiに直接追加できるようになり、これによりチャットボットがコードを生成・解説したり、既存のコードをデバッグしたりといった支援が可能になります。GitHubとの接続は、Geminiのプロンプトバーにある「+」ボタンをクリックし、「コードをインポート」を選んでGitHubのURLを貼り付けるだけで完了します。
TikTokは火曜日、自社初となる画像から動画を生成するAI機能「TikTok AI Alive(ティックトック・エーアイ・アライブ)」を発表しました。この新機能により、ユーザーは静止画像をTikTokストーリー内で動画に変換できるようになります。
The Android Show で、GoogleはGeminiをWear OSスマートウォッチとGoogle TVに導入することを発表しました。この発表は、GoogleがGoogleアシスタントをGeminiに置き換える計画の一環であり、今後すべてのデバイスとプラットフォームで展開される予定です。今回の発表は驚くべきことではなく、多くのユーザーは、GoogleがAIアシスタントをWear OSやGoogle TVにも導入することを期待していました。
AmazonのオーディオブックサービスであるAudibleは火曜日、特定の出版社と提携し、紙の書籍や電子書籍をAIナレーションのオーディオブックに変換する取り組みを開始すると発表しました。この取り組みは、急成長するオーディオブック市場においてAppleやSpotifyなどとの競争を見据え、カタログを迅速に拡大することを目的としています。
Googleは2年前からGoogle検索でAI要約結果(AI Overviews)のテストを開始し、現在もこの機能を新たな地域や言語へ拡大し続けています。Googleの試算によれば、この取り組みは大きな成功を収めており、現在では100カ国以上で月間15億人を超えるユーザーがAI Overviewsを利用しています。
AnthropicのCEOであるダリオ・アモデイ氏は木曜日、世界の最先端AIモデルの内部構造について研究者たちがいかに理解していないかを強調するエッセイを発表しました。これに対応するため、アモデイ氏は、Anthropicが2027年までにAIモデルのほとんどの問題を確実に検出できるようにするという野心的な目標を掲げています。
OpenAIは水曜日、ChatGPTの新しい画像生成機能の技術をAPIにも提供し、開発者が自分のアプリやサービスに統合できるようにしました。
Midjourneyとニューヨーク大学の研究者たちは、言語モデルがより多様で創造的なテキストを生成できるようにする新たなアプローチを開発しました。それによって、品質を大きく損なうことなく、表現の幅を広げられる可能性があります[...]
エルサレム・ヘブライ大学の研究者たちは、RAG(Retrieval Augmented Generation)において処理される文書の数が、全体のテキスト量が同じであっても言語モデルの性能に影響を与えることを発見しました[...]
Metaとウォータールー大学の研究者たちは、**MoCha(モチャ)**というAIシステムを開発しました。このシステムは、音声と自然な動きを同期させたキャラクターアニメーションを自動生成することができます[...]