本文整合自然语言处理(NLP)与机器学习领域的成熟技术,通过两个实战案例构建 “文本预处理 - 特征提取 - 情感分类 - 痛点挖掘” 的完整解决方案,覆盖金融科技与酒店服务两大高频应用场景。第一个案例聚焦工商银行手机银行 APP,运用 Jieba 分词、SnowNLP ...
在自然语言处理(NLP)领域,很多人会问:如何从零开始,构建一个真正可用的 NLP 流水线? 常见的教程往往只聚焦于某一个环节,比如“训练一个 Word2Vec 模型”或者“跑一次 LDA 主题建模”。但在真实项目中,往往需要一个系统性的流程:从原始文本 → 预 ...
信息时代的高速发展让我们得以使用手机、电脑等设备轻松从网络上获取信息。但是,这似乎也是一把双刃剑,我们在获取到众多信息的同时,又可能没有太多时间去一一阅读它们,以至于“收藏从未停止,学习从未开始”的现象屡见不鲜。 这篇文章估计以后也 ...
基于LDA主题模型和主题困惑度的文本主题提取系统 隐含狄利克雷分布(Latent Dirichlet Allocation,LDA),是一种主题模型(topic model),它可以将文档集中每篇文档的主题按照概率分布的形式给出。LDA主题模型可以看作是一个生成文档的机器,向机器内输入一个文档 ...
本项目旨在归纳总结自然语言处理工程师常见实践内容,每个模块尽量包含理论(经典算法和最新paper)和实践部分。 使用Python进行自然语言处理相关实践,如新词发现,主题模型,隐马尔模型词性标注,Word2Vec,情感分析 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果