1、从 MySQL 查询文本数据(如文章、评论、产品描述)
2、用 Python 处理文本,提取关键词
3、将关键词结果存回 MySQL,用于后续分析或展示
💡 如何结合 MySQL 做关键词挖掘?
步骤示例:
1、数据准备
在 MySQL 中创建表存储待分析文本:
sql
CREATE TABLE articles (
id INT PRIMARY KEY,
title VARCHAR(255),
content TEXT
);
2、导出数据到 Python 分析
python
import mysql.connector
from sklearn.feature_extraction.text import TfidfVectorizer
import jieba
连接 MySQL
conn = mysql.connector.connect(...)
cursor = conn.cursor()
cursor.execute(SELECT content FROM articles WHERE content IS NOT NULL)
texts = [row[0] for row in cursor.fetchall()]
获取每个文档的Top关键词
for i, doc in enumerate(texts):
top_keywords = [feature_names[idx] for idx in tfidf_matrix[i].toarray().argsort()[0][-5:][::-1]]
print(fDocument {i}: {top_keywords})