港股蛇年首个交易日,有望憧憬红盘高开,但也要提防虎头「蛇尾」。受惠于国产人工智能(AI)模型DeepSeek爆红,海外投资者对中资科技股价值重估,若以上周港股ADR比例计,恒指周一料高开285点至20511点,其中以阿里巴巴(9988)ADR较港收市 ...
今年春晚的语言类节目,由于时长限制,大家可能还有些意犹未尽。其实,近来有不少小品都是源自《一年一度喜剧大会》的精彩改编。文心一言不仅准确无误地报出了改编节目的数量,甚至对《小明一家》将原版妈妈的角色改成了爷爷这一细节都了如指掌。o3 mini ...
「俗话」说得好:「打不过就加入」。 一开始便对DeepSeek赞赏有加的英伟达,刚刚宣布:「DeepSeek-R1正式登陆NVIDIA NIM」。据介绍,在单个NVIDIA HGX H200系统上,完整版DeepSeek-R1 ...
2025年2月1日,全球人工智能领域再度掀起波澜,随着DeepSeek的崛起,OpenAI和阿里云的回应动作引发广泛关注。OpenAI于今晨发布了全新推理模型o3-mini,标志着其在大模型竞赛中的又一重大进展。该模型专为降低成本而设计,推出三个版本,用户可通过ChatGPT体验这一新功能。而在中国市场,阿里云也乘势推出了新一代的百炼qwen-max系列模型,不仅降低了使用成本,更在多个基准测试中 ...
此前,DeepSeek因推出了性能良好、开源且免费的V3和R1模型而受到广泛关注,也由于低廉的模型训练成本而走出了一条独特的道路,通过开源重构了全球的AI竞争格局,使低成本创新成为颠覆行业的创新路径。过去一周多的时间里,国内外大模型厂商从“紧急上线” ...
中国在生成式AI领域正在赶超美国,这将对AI供应链产生深远影响。开源权重模型正在将基础模型层商品化,为应用开发者创造了巨大的机遇。规模化并非AI进步的唯一道路,尽管算力备受瞩目和炒作,但算法创新正在迅速降低训练成本。
该模型基于 Apache 2.0 许可证发布,允许开发者自由修改、部署和集成到各种应用程序中,对标 Meta 的 Llama 3.3 70B 和阿里巴巴的 Qwen 32B 等更大模型,官方声称在相同硬件上,提供超过三倍的性能。
1月最后一天,DeepSeek的热度依旧高涨。在美国,无论是AI从业者还是普通民众,都感受到了来自中国AI技术的冲击。Anthropic ...
随着Qwen(吴恩达团队已经用了几个月)、Kimi、InternVL和DeepSeek等模型的推出,中国在文本模型上的差距正在缩小,而在视频生成等领域,中国甚至已经展现出了一些领先优势。 受到美国AI芯片禁令的影响,DeepSeek团队不得不在性能相对较低的H800 GPU上跑模型,而这也推动了他们在优化方面的大量创新。最终,模型训练成本(不包括研究成本)不到600万美元。
1月30日,阿里巴巴发布Qwen 2.5-Max模型,Qwen2.5-Max模型代表阿里云团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens,在多项基准测试中几乎全面超越了DeepSeek-V3、GPT-4o和Llama-3.1-405B。阿里过去在云业务总体capex投入长期位居互联网大厂前列,Qwen2.5-Max模型表现优越,本轮中概AI资产重估,以阿里为代表的低估值、主业企 ...
同样面对 AI 大模型领域的“鲶鱼”DeepSeek,不同于美国 AI 公司 Anthropic CEO 达里奥·阿莫迪(Dario Amodei)用“万字檄文”施压白宫加强管制的敌对态度,法国明星 AI 公司 Mistral AI ...
初步统计,总台蛇年春晚在境内新媒体端的实时直播收视次数和互动量均创新纪录,新媒体端直点播收视次数28.17亿次,较去年同期增长6.9亿次;春晚社交媒体话题阅读量达166亿次,比去年同期增加5.5亿次。