文章目录
-
-
-
- BERTopic简介
- 模型加载地址
- 文本加载
- 数据处理
- BERTopic模型构建
- 模型结果展示
- 主题可视化
- 总结
BERTopic论文地址:BERTopic: Neural topic modeling with a class-based TF-IDF procedure
BERTopic
是一种结合了预训练模型BERT
和主题建模的强大工具。它允许我们将大规模文本数据集中的文档映射到主题空间,并自动识别潜在的主题。
它背后的核心思想是通过BERT
模型来捕获文档的语义信息,并然后使用主题建模技术来对这些语义信息进行聚类,从而得出主题。
模型加载地址