本文介绍如何构建一套文本聚类流水线,将大语言模型嵌入与基于密度的聚类算法 HDBSCAN 相结合,在无标注文本数据中自动发现主题。 当前的生成式 AI热潮,表面上似乎主要集中在聊天界面与提示词工程,但大语言模型(LLM)的实际应用范围远不止于此。
主题建模是一种无监督的机器学习技术,它可以自动识别文档(文本数据)中的不同主题。 【51CTO.com快译】通过主题建模,你可以收集非结构化数据集,分析文档,并获得相关和所需的信息,这些信息能帮你做出更好的决策。 执行主题建模有不同的技术(如 ...