点击上方“Deephub Imba”,关注公众号,好文章不错过 !大多数 Python 数据工程师最早学的是 pandas。因为它是行业标准,能用而且一直够用,所以一般也没人质疑过它。Pandas 设计于 2008 ...
境外网络安全机构 2026 年监测数据显示,生成式 AI 批量制作的钓鱼邮件已成为政企单位数据泄露、个人财产受损的核心攻击载体,传统基于黑名单、固定关键词匹配的邮件防护机制存在显著逃逸漏洞。本文以境外媒体披露的 2026 ...
过去一年,AI Agent 在编程、写作、搜索、数据分析等场景里越来越常见。 很多学者也开始把Claude Code、Cursor、Codex这类智能体拉进自己的科研流程里,让Agent帮忙改论文、做图表、查资料。 但真正的科研任务,不是把论文丢给 Claude Code,然后让它「帮我研究一下」就完事了。 比如想写一篇文献综述,Agent 不能只是把十几篇论文简单总结一遍,而是需要把不同论文之间 ...
本文介绍如何构建一套文本聚类流水线,将大语言模型嵌入与基于密度的聚类算法 HDBSCAN 相结合,在无标注文本数据中自动发现主题。 当前的生成式 AI热潮,表面上似乎主要集中在聊天界面与提示词工程,但大语言模型(LLM)的实际应用范围远不止于此。
这项由卡内基梅隆大学与阿布扎比穆罕默德·本·扎耶德人工智能大学联合开展的研究,以预印本形式发布于2026年6月22日,论文编号为arXiv:2606.23608,有兴趣深入了解的读者可通过该编号查询完整论文。
好书不厌百回读,新书则常能带来惊喜。即将迎来的北大社6-7月新书,既有面向学术与大众阅读的人文社科佳作,也有适合青少年拓展视野的科普与素养读物。