OpenAI запускає GPT-4o та інші мультимодальні моделі ШІ

311
OpenAI нещодавно запустив мультимодальну модель штучного інтелекту під назвою GPT-4o, яка поєднує кілька модальних даних, таких як зір, мова та звук, для досягнення крос-модального навчання. Крім того, такі моделі, як Project Astra від Google, Gork-3 від Маска, AutoGLM від Zhipu AI і Janus-Pro від DeepSeek також досягли значного прогресу в області мультимодального AI.