argmax、Apple GPUやNeural Engineに最適化した音声認識AI「WhisperKit」を発表

※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。

WhisperKitパフォーマンス

argmaxが、高い精度で文字起こしができる音声認識AIを、GPUやNeural Engineに最適化した「WhisperKit」を発表しています。

OpenAIの「Whisper」は低遅延でオーディオを処理するように設計されていないため、リアルタイム速度でのストリーミング文字起こしは非常に困難です。

WhisperKitは、Appleシリコン上で最低のレイテンシーと最高のスループット状態の両方を達成することを目指して開発されていて、本日のベータリリースでは、iPhone、iPad、Mac でストリーミング文字起こしアプリケーションのロックを解除するために、最初に遅延の最小化に意図的に重点を置いたバージョンだそうです。

Swift プロトコルにモジュール化されているため、カスタム動作の実装は個々のプロトコル拡張に集約されます。また、コードの読み取り時間についても最適化されているため、WhisperKit の拡張は難しくなく、コントリビューションガイドとロードマップリソースは、機能が完成し、安定したリリース候補段階に到達するためのタイムラインを開発者に可視化することを目的としているとしています。

オーディオエンコーダは「Deploying Transformers on the Apple Neural Engine」に従って、Core ML を使用して「Whisper.cppプロジェクト」によって以前に最適化されました。簡単に言うと、この作業では、一連のNeural Engineコンパイラヒントを PyTorch コードとして導入し、Core ML に変換すると高パフォーマンスのモデルに変換されます。

Neural Engine コンパイラが Apple のプライベートフレームワークであることを考えると、これはハードウェアの使用率を高めるためにコンパイラを微調整するブラックボックス最適化の一種です。

これは Whisper のオーディオエンコーダを高速化するための優れた出発点であり、私たちの以前の成果がさまざまなオープンソースプロジェクトに採用されていることを嬉しく思います。

WhisperKitでは、これらのコンパイラヒントをさらに改善し、以前の最良の実装と比較して、iPhone 12 ～ 15 でさらに1.86 倍から 2.85 倍の高速化を実現したと説明しています。

Introducing WhisperKithttps://t.co/smfsWo6HLN pic.twitter.com/Xhy2mRKq6N
— argmax (@argmaxinc) January 30, 2024

argmax、Apple GPUやNeural Engineに最適化した音声認識AI「WhisperKit」を発表

関連記事

macOS 26.2：Thunderbolt 5接続した複数台Mac Studio (2025)をAIクラスタリング使用する

Apple、1枚の写真からフォトリアリスティックな新規ビューを高速に合成するアプローチ「Sharp」をGitHubで公開

visionOS 26.2：Apple Vision Pro（M5）のGPUを使用したAI処理性能が向上

Google、Gentle MonsterとWarby Parkerと共同開発したAIメガネを2026年発売予定

Pollo AI プロダクトアバター：商品画像が数分でプロモ動画に変身する次世代AIツール【PR】

AppleのAI戦略担当シニアヴァイスプレジデントJohn Giannandrea氏が退任、後任者として元MicrosoftのAmar Subramanya氏が入社

新着記事

Apple、Apple Watchのフィットネスに「謹賀新年チャレンジ2026」を追加

Amazon、SwitchBotのスマート加湿器「SwitchBot 気化式加湿器」を13,860円で販売中（タイムセール）

Apple Store、CalDigitの15ポート搭載Thunderbolt 5接続ドック「CalDigit TS5 Thunderbolt Dock」を販売開始

Apple Store、Tech21のAirPods 4用ケース「Tech21 EvoArt for AirPods 4限定エディション」を販売開始

中国Apple、iPhone 17 ProのプラトーにMOJO FAMILYシールを貼った「MOJO FAMILY痛版」を広告展開

MacOTAKARAの広告に関して（Regarding advertising）