时间:2025-08-07来源:ai02门户网
8月6日消息,OpenAI当地时间昨日以Apache2.0许可证的形式推出了两款gpt-oss系列开放推理模型,其中参数规模较小的gpt-oss-20b模型可在仅配备16GB内存的边缘设备上运行、参数更多的gpt-oss-120b则能在单个80GBGPU上高效运行。
AMD与高通均宣布旗下硬件支持gpt-oss系列开放模型,具体是AMD锐龙AIMax+395处理器支持gpt-oss-120b、AMDRadeonRX907016GB显卡支持gpt-oss-20b、高通旗舰骁龙平台支持gpt-oss-20b。
AMD宣称锐龙AIMax+395是全球首款能运行gpt-oss-120b模型的消费级AIPC处理器:采用GGML框架转换的MXFP4格式gpt-oss-120b大约需要61GB显存,而"StrixHalo"平台在128GB统一内存下支持将96GB分配给GPU,轻松满足这一需求。
锐龙AIMax+395在gpt-oss-120b上有30Token/s的输出速率,同时支持该模型的MCP模型上下文协议实现。
而RadeonRX907016GB显卡则能在gpt-oss-20b上实现出色的首Token输出时间(TTFT)和每秒Token输出数量表现。
高通表示根据早期测试gpt-oss-20b可在端侧实现出色思维链推理表现,开发者可通过HuggingFace和Ollama等热门平台在搭载骁龙芯片的设备上访问gpt-oss-20b模型并充分发挥其功能。
上一篇:都说这个地级市,宜居宜业宜AI
下一篇:最后一页
网发此文仅为传递信息,不代表认同其观点或证实其描述。同时文中图片应用自网络,如有侵权请联系删除。