Hugging FaceがHub全体をGit LFSからXetストレージへ移行——100万ユーザーを無停止で静かに移行した方法
HuggingFaceが20PBのデータを保有する50万超のリポジトリをGit LFSからXetへ無停止移行し、100万ユーザーへの提供を開始した。
LLM・AIエージェント・画像生成・音声合成など生成AI全般の最新ニュース
HuggingFaceが20PBのデータを保有する50万超のリポジトリをGit LFSからXetへ無停止移行し、100万ユーザーへの提供を開始した。
Gradio 5.38.0でMCPサーバーにローカルファイル自動アップロード、リアルタイム進捗通知、OpenAPI→MCP一行変換など5つの重要機能が追加された。
Hugging FaceのCLIツールが`huggingface-cli`から`hf`に改名され、`hf
GradioのMCP統合を使い、LLMからHugging FaceのAIモデルを直接呼び出すバーチャル試着AIアシスタントを構築する方法を解説。
OpenAIが117B・21Bパラメータの混合エキスパート(MoE)オープンウェイトモデル「GPT OSS」をApache 2.0ライセンスで公開し、コンシューマー向けGPUでも動作可能な設計が注目を集めている。
HuggingFaceのAccelerateとAxolotlが複数の並列化戦略を自由に組み合わせてマルチGPU学習できる「ND-Parallel」機能を統合した。
Hugging FaceがスプレッドシートUIでデータセットの構築・変換・エンリッチメントをノーコードで行えるオープンソースツール「AI Sheets」を公開した。
ArmのKleidiAIがExecuTorch 0.7にデフォルト統合され、Llama 3.2が数十億台の既存Androidデバイス・Raspberry Pi 5で実用動作可能になった。
Model Context Protocol(MCP)を活用し、AIが研究論文・実装コード・学習済みモデルをプラットフォームをまたいで自動収集・統合する手法が登場した。
Hugging FaceがカスタムCUDAカーネルを複数アーキテクチャ向けにビルド・公開できるライブラリ「kernel-builder」の詳細ガイドを公開した。
NVIDIAが英語推論データを仏・西・独・伊・日本語に翻訳した600万件規模のデータセットと、9Bパラメータの高効率モデル「Nemotron Nano 2」を同時公開した。
Googleが308Mパラメータ・2Kコンテキストの多言語埋め込みモデル「EmbeddingGemma」を公開し、500M以下のテキスト専用モデルとしてMTEBベンチマーク最高スコアを達成。
Johns Hopkins大学がModernBERTをベースに3兆トークンで学習した多言語エンコーダ「mmBERT」を公開し、XLM-Rを超える性能と速度を実現した。
Hugging Faceが2.2BパラメータのビジョンモデルをGUI自動操作エージェントへと育て上げる2段階訓練手法「Smol2Operator」を全データセット・コードとともにオープンソースで公開した。
Hugging FaceがApple開発者向けのSwiftライブラリ「swift-transformers」v1.0をリリース。MLXとエージェント用途に注力する方針も発表。
NVIDIAが日本の人口統計・文化的特性に基づく600万件の合成ペルソナデータセットをオープンソースで公開し、ソブリンAI開発の基盤を提供。
IntelがOpenVINO.GenAIと推測デコーディングを組み合わせ、ローカルAIエージェント向けQwen3-8Bの推論速度を最大1.4倍に向上させる手法を公開した。
Python ASGIフレームワーク「Starlette」がv1.0に到達。Claudeのスキル機能を活用し、最新APIに対応したコード生成を実現する手法が公開された。
イーロン・マスク氏がテスラとSpaceXのAI・ロボティクス需要に対応する半導体製造施設「Terafab」の建設計画を明らかにした。
AIコーディングツール大手Cursorが、新モデルComposer 2の基盤に中国Moonshot AIのオープンソースモデル「Kimi 2.5」を使用していたことを認めた。