阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家 (MoE)模型的时间较不寻常,正值农历新年第一天,大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索 ...
阿里巴巴旗下的阿里云介绍了“通义千问”大语言模型的最新版本Qwen2.5 Max,称其在各项基准测试中均超越了OpenAI的GPT-4o、DeepSeek-V3和Meta的Llama-3.1-405B模型。
据阿里巴巴称,使用这种技术的新 Qwen 模型在关键基准测试中超越了 DeepSeek-V3(该初创公司在去年 12 月底发布的最新非推理模型),包括 ArenaHard、LiveBench 和 MMLU-Pro。公司还声称其性能超过了 Anthropic 的 Claude 3.5 Sonnet、OpenAI 的 GPT-4 和 Meta 的 Llama 3.1-401B。
从知情人士处获悉,全球顶尖人工智能科学家许主洪(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。 据知情人士透露,许主洪将专注于AI To ...
Alibaba Cloud Linux V3 011版本,针对AI的搜推场景,通过自研的OS内核特性,并结合开箱即用的针对性的系统参数的调优,在相同ECS的异构实例规格下AI的 ...