大模型上线前都需要经过严格测试,以防出现不良行为。6月16日,OpenAI 在博客上发布了一种“模拟部署”方法,也就是在模型正式上线前,把过去真实用户对话中的旧模型回答去掉,让候选新模型重新回答,再观察它在这些接近真实使用场景中的失败模式和发生频率,用来提前预测模型上线后的风险。这个方法说明,AI安全评估正在从“考卷式测评”走向“真实场景预演”。 参考文献:Predicting model beh ...
6月23日,Anthropic发布了Claude Tag——一个常驻Slack频道的AI团队成员。 3个工程师和1个PM在同一个Slack频道里debug。有人@了Claude,让它查代码仓库、拉数据仓库的指标、给GitHub开一个PR。
专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!6月30日深夜到7月1日凌晨,Anthropic在X上连发两条消息。Claude官方号先扔出Sonnet ...
2022 年一场科技峰会上,Luta Security创始人兼首席执行官凯蒂・穆苏里斯。亚马逊研究人员发现Anthropic旗下Fable ...
特斯拉(TSLA)今年面临诸多挑战。从影响整体股市的宏观经济问题——这家电动汽车制造商未能幸免——到尚未带来回报的巨大资本支出,再到喜忧参半的财务业绩,该公司股价年初至今下跌了6%,而同期标普500指数上涨了8%。不过,有理由认为特斯拉股价在7月2日 ...
最近,A24做了一件很不像A24的事。
最丰富的机器人数据来自遥操作:由人类一遍又一遍地操控机器人完成某项任务。专家示教通常能够稳定地产生优秀策略,但它很难规模化。每一小时数据都意味着一小时的人类劳动成本;在某些情况下甚至需要更多,因为示教质量本身很重要。更糟的是,每一种机器人、每一种夹爪、每一个实验室,往往都会产生一套彼此不兼容的小型数据集。GR00T ...
宝马正积极布局印度豪华车市场,计划将下一代X5 SUV的长轴距版本引入该地区。这一决策源于印度市场对长轴距车型的强烈需求——当地豪华车消费者普遍配备专职司机,对后排及腿部空间有着极高要求。此前宝马3系、5系及iX1长轴距版在印度市场已取得显著成功,这三款车型最初均针对中国市场开发,如今成为宝马拓展印度市场的关键产品。
在过去的十多年里,以 GPU 为核心的数字计算统治了 AI 领域,更大的集群、更高的带宽、更强的 GPU、更密集的数据中心,似乎是通向下一代 AI 的主流路径。 可随着模型参数量迈向万亿级,行业开始频繁提及「能耗」一词,甚至一个更为底层的问题也随之而来:如果 AI 继续按现有方式扩张,电从哪里来? 无疑,AI 「电费账单」与能源消耗,已逐步从运营成本演变为制约整个行业发展的「结构性瓶颈」。 面对这 ...