Mem0は、自社製品がAIスマート・ボディ・メモリー技術において業界最高水準(SOTA)に達し、特定のベンチマークにおいてZepを含む競合他社を凌駕したとする調査報告書を発表した。しかし、これは...
最近、インターネット情報技術中央弁公室は、「明確-AI技術の乱用を是正する」という特別行動を開始し、現在の人工知能の発展で生じている多くの問題のガバナンスに明確なレッドラインを引いた。このイニシアチブは、AI技術の健全な発展を導き、潜在的なリスクを防止することを目的としている。この特別行動は13の重要な方向性に焦点を当て、2つのフェーズに分かれている。
2025年5月5日 - AIをリードするOpenAIは、AIコーディングツールの新興企業Windsurfを約30億ドルで買収するという注目すべき取引を確認した。この買収は、オープンAIにとってこれまでで最大の買収であるだけでなく、過去に買収したRockset社や...
最近の観察によると、生成型人工知能(AI)が人々の日常生活に忍び寄り、当初は一般的に考えられていた仕事支援の枠をはるかに超えた応用が進んでいる。インドのフィンテック企業CREDの創業者であるクナール・シャーは、4月に開催されたサミットで、50~60%ものChatGPTがAIを利用していると述べた。
グーグルのAIメモツール「NotebookLM」が最近アップデートを受け、個人の知識管理と生産性向上のための主要ツールになるための道筋が明らかになりつつある。最新の開発には、中国語を含む多言語の音声ブロードキャスト・サポートと、今後のモバイル・アプリが含まれる。 N...
ソフトウェア開発ツールを提供するJetBrainsはこのほど、コード補完のために特別に設計された言語モデルであるMellumの基本バージョンをオープンソース化し、Hugging Faceプラットフォームで利用可能にしたと発表した。この動きは、ソフトウェア開発におけるAI分野の透明性とコラボレーションを促進することを目的としている。 Mellumの設計理念は、AIを追い求めることではなく、AIを開発することである。
大規模言語モデルの分野に新しい仲間が加わった。最近、大規模言語モデルのQwenファミリーが最新バージョンQwen3をリリースした。 開発チームによると、そのフラッグシップモデルであるQwen3-235B-A22Bは、コーディング能力、数学能力、汎用能力のベンチマークにおいて、DeepSeek-R1、o1、o3に匹敵することを示している。
OpenAIはこのほど、最新の画像生成モデル「gpt-image-1」がAPIを通じて開発者や企業に提供されたことを発表した。このモデルは以前ChatGPTで使用され、その強力な画像生成機能でユーザーから好評を得ていました。OpenAIによると、統合された...
レニー・ニュースレターがヘビー級の定期購読バンドル・サービスを開始:価値の高いAIと生産性向上ツールのコレクション 先日、テクノロジーと製品成長の分野で影響力を持つレニー・ラチツキーが、有名なレニー・ニュースレターを通じて魅力的なソフトウェアを発表した。
ByteDanceの参入:Coze SpaceはAIエージェント・コワーキングの新しいパラダイムを定義できるか? 最近、ByteDanceのAIエージェント開発プラットフォームであるCozeは、Coze Space(space.coze.cn...)というプロジェクトを静かに立ち上げた。
先月発表された次世代オープンモデルGemma 3に続き、Googleは最近、量子化対応トレーニング(QAT)に最適化された新バージョンを発表し、モデルのエコシステムを拡大した。 Gemma 3は、そのBF16の精度が以前から認められていた。
グーグルはこのほど、動画生成モデル「Veo 2」がジェミニ・アドバンスト・サービスと実験的プラットフォーム「Whisk」に正式に統合されたことを発表した。これにより、Google One AIプレミアムの契約者は、テキストプロンプトや既存の画像から短い動画を直接生成できるようになった。
中国のビッグモデル分野で注目すべき動きとして、ウィズダムスペクトラムAIは最近、32Bと9BのパラメータスケールをカバーするGLMビッグ言語モデルの新シリーズを、完全にオープンなMITライセンスの下でオープンソースとしてリリースした。この新しいモデル・ファミリーには、基本モデル、推論モデル、革新的な「熟考」モデルが含まれ、いずれも...
スタンフォード大学の人間中心人工知能研究所(HAI)は、人工知能指数報告書の第8版(2025年版)を発表した。同レポートは、過去1年間における研究開発、応用、投資におけるAIの著しい加速を描くと同時に、責任あるAIの実践、社会的信頼、技術開発が必要とされる分野を指摘している。
今日は、ますます熱くなっている技術、テキスト読み上げ、別名TTS(Text-to-Speech)についてお話ししましょう。簡単に言うと、コンピュータにテキストを読み上げさせ、人間の音声のように読み上げることです。ここ数年、短いビデオの吹き替え、オーディオブックの制作からインテリジェントなカスタマーサービス、バーチャルアシスタントまで、TTSの姿はいたるところにある...。
最近、OpenAIは、インターネット閲覧におけるAIエージェントの能力を評価するために設計された新しいベンチマークテスト「BrowseComp」を発表した。このベンチマークは、科学的発見からポップカルチャーまで幅広い領域をカバーする1,266の問題で構成され、エージェントにオープンなウェブ環境でのナビゲーションを要求する...
AIリサーチ・アシスタントの台頭:宿題を手伝ってくれるのは誰? 情報化時代の研究は、しばしば膨大な量のデータを踏破することを意味する。これまで研究者は、重要なコンテンツをChatGPTのような大きな言語モデルに与えて分析する前に、手作業で情報を検索し、ふるい分け、分類しなければならなかった。しかし、OpenAI ...
AI技術がプレゼンテーション・デザインに与える影響 プレゼンテーション(PPT)の作成は、社会人にとって、特に重要なプレゼンテーションの前夜には、しばしば時間のかかる退屈な作業となる。レイアウトや図表を何度も修正・調整するには、かなりの時間を投資しなければならないことも多い。近年、人工知能(AI)技術の発展がこの分野に貢献している...
Cloudflareは最近、AutoRAGサービスのオープンベータを発表した。この完全に管理されたRAG(Retrieval-Augmented Generation)パイプラインは、コンテキストを考慮したA...