Realtime API - 搜索 News

9 个月

OpenAI发布端对端语音模型GPT-Realtime，助力开发者构建语音智能体

北京时间8月29日凌晨，OpenAI通过直播发布其迄今最先进的端对端语音模型（Speech-to-Speech）GPT-Realtime，并宣布Realtime ...

OpenAI首发GPT-5级推理语音模型，传统同传不存在了？

智东西5月8日报道，5月7日，OpenAI在Realtime API中推出三款音频模型—— GPT‑Realtime‑2 （首个具备GPT‑5级推理的语音模型）、 GPT‑Realtime‑Translate （实时翻译）和 GPT‑Realtime‑Whisper （流式转录），分别面向复杂推理、实时翻译和流式转录场景 ...

腾讯网

OpenAI工程师亲自修订：用ChatGPT实时语音API构建应用

OpenAI Realtime API 的「说明书」。 OpenAI 实时 API 的架构对话语音是 OpenAI 实时 API 支持的核心用例。对话语音 API 需要：管理多个用户和 LLM 轮次的对话状态；确定用户何时结束对话（并期待 LLM 的响应）；处理用户中断 LLM 输出；用户语音的文本转录、函数调用 ...

投资界

MiniMax Realtime API 亮相 RTE 2024实时互联网大会，系国内首个Realtime API

10月25日，RTE 2024 第十届实时互联网大会正式开幕。本次大会由声网和RTE开发者社区联合主办，以“AI 爱”为主题，推出覆盖实时互联网全生态的论坛及周边活动共计20余场。声网创始人兼CEO赵斌在主论坛以《实时互动十年：从Web RTC到生成式AI时代的RTE》为题作 ...

25 天

OpenAI 最智能 AI 语音模型：GPT-Realtime-2 登场，GPT-5 级推理能力

GPT-Realtime-2 专为实时交互设计，是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下，能在对话过程中进行推理、调用工具，并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手，并能执行多步骤任务。

凤凰网

OpenAI发布Realtime API，助力第三方应用集成其语音合成技术

IT之家 10 月 2 日消息，科技媒体 The Decoder 昨日（10 月 1 日）发布博文，报道称 OpenAI 在旧金山开发者大会（DevDay）上，发布了 Realtime API，可以让开发者调用该 API 在第三方应用中集成语音合成技术。 OpenAI 表示开发者通过调用新的 Realtime API，可以在其应用中添加 ...

24 天

OpenAI发布三款实时语音模型：GPT-Realtime-2引领推理与翻译转录新高度

近日，OpenAI推出了三款面向实时语音场景的专用模型，并通过Realtime API向全球开发者开放调用。这三款模型分别聚焦于语音推理、多语言翻译和低延迟转录，旨在解决传统语音交互中的延迟响应、打断处理困难及跨语言支持不足等问题。 GPT-Realtime-2作为此次发布的旗舰产品，首次将GPT-5级别的推理能力引入语音交互领域。该模型在保持对话自然流畅的同时，支持实时推理决策、工具调用及用户打 ...

来自MSN

Altman：在API中发布小型语音模型GPT-5 Pro

Sam Altman表示，OpenAI在API推出GPT-5 Pro，公司还在API中发布规模更小的语音模型GPT-realtime-mini。Altman认为，语音将成为人们与人工智能（AI）交互的主要方式之一。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果