导读 最近,我用Python对《三国演义》的TXT文本进行了词频分析,发现了一些有趣的现象!三国的故事大家都耳熟能详,但通过数据分析,能更直观地...
最近,我用Python对《三国演义》的TXT文本进行了词频分析,发现了一些有趣的现象!三国的故事大家都耳熟能详,但通过数据分析,能更直观地了解哪些人物或词汇出现得最多。三国里谁是真正的主角?🤔
首先,我将《三国演义》的文本导入Python中,并利用jieba库进行分词处理,然后统计每个词出现的频率。结果显示,“曹操”、“刘备”和“诸葛亮”这三个名字出现频率极高,果然是贯穿全书的核心人物!😄 不过,还有一个意外发现——“吕布”虽然戏份不少,但词频却相对较低,看来他虽勇猛,却并非故事主线的绝对主角。
此外,一些高频词汇如“天下”、“军师”、“诸侯”也反映了这部小说的主题。通过这次分析,不仅重温了经典,还学到了很多Python技能,真是一举两得!💡 如果你也感兴趣,不妨自己试试看吧!📚💻
Python 数据分析 三国演义 词频分析
版权声明:本文由用户上传,如有侵权请联系删除!