本文介绍如何构建一套文本聚类流水线,将大语言模型嵌入与基于密度的聚类算法 HDBSCAN 相结合,在无标注文本数据中自动发现主题。 当前的生成式 AI热潮,表面上似乎主要集中在聊天界面与提示词工程,但大语言模型(LLM)的实际应用范围远不止于此。
当下AI模型领域呈现出颠覆固有认知的发展态势:2025年初问世的四十亿参数小型模型,如今在标准推理基准评测中,性能已然赶超参数量达到自身七倍的大尺寸模型。 谷歌Gemma 3 ...