STYLYは2024年6月28日、マルチモーダルAI*「Google Gemini」を活用したSTYLY for Vision Pro向けソリューションのデモ映像を公開しました。
*マルチモーダルAI:画像、音声、テキストなど複数の異なる情報源から情報を収集し、統合して処理するAI
本ソリューションは、2024年6月11日(火)に開催されたAppleによる開発者向けカンファレンス「WWDC(Worldwide Developers Conference)」において発表された、visionOS向けエンタープライズAPIによるカメラへのアクセスと、マルチモーダルAI「Google Gemini」、そしてSTYLY for Vision Proがこれらを繋ぐ役割を果たすことで実現しています。
データを事前学習させることにより、導入事業者のニーズに合わせたサービスの構築が可能なだけでなく、施設ナビゲーションや日本語表記しかない案内掲示の多言語音声案内などに応用が可能なため、特にインバウンド需要の強い観光業においても有用なユースケースになると考えられます。
今後はOpenAIをはじめとする他のAIとの連携や、主要MRデバイスへの対応も進める予定です。
関連ニュースはこちら