跳到主要内容
Z

词频统计工具

统计每个词出现的次数,并给出排名、数量和百分比。支持停用词过滤、Top-N 显示以及导出完整表格为 CSV。

免费 无需注册 客户端运行 注重隐私 Updated
# 词语 次数 %
粘贴文本即可查看表格。

使用方法

  1. 1 将文本粘贴到左侧文本框中。
  2. 2 选择要显示的高频词数量。
  3. 3 可选:忽略常见的英文停用词,如 “the” 和 “a”。
  4. 4 将完整表格导出为 CSV 以便进一步分析。

为什么使用此工具

  • 分词器支持 Unicode,能正确处理带重音符号的字母、数字和撇号。
  • 默认开启停用词过滤,让真正有意义的关键词更突出。
  • 百分比列反映的是过滤后词元总数中的占比。
  • 导出的 CSV 文件包含完整的未过滤表格,而不仅仅是当前显示的 Top-N。

常见问题

文本是如何被分词(tokenize)的?

文本会先转换为小写,然后通过正则表达式 /[a-zà-ÿ\d']+/giu 匹配连续的字母、数字和撇号字符。因此 “don't” 仍会被视为一个词元;标点符号和表情符号则会作为分隔符。

哪些停用词会被忽略?

使用的是一份简短的英文停用词表,包含常见的冠词、介词、代词和助动词——与我们的 Word & Character Counter 工具中「高频关键词」功能所使用的列表相同。

百分比是基于过滤后的词元还是原始词元计算的?

如果启用了停用词过滤,则基于过滤后的数量计算;否则基于词元总数计算。无论哪种方式,该列都反映的是实际被统计的词的占比。

有哪些相关工具?

如需包含阅读时间的整体文本摘要,可使用 Word & Character Counter;如果需要按出现次数筛选行,可使用 Filter Lines。

什么是 词频统计工具?

词频统计工具(Word Frequency Counter)用于统计文本中每个词出现的次数,并显示其排名、数量和占比。工具内置停用词过滤、Top-N 选项,并支持将完整表格导出为 CSV。整个过程完全在浏览器中运行,用于分析关键词密度和高频词,无需将数据上传到服务器。

概要

词频统计工具 是 Zerethon Tools 提供的免费 开发者 工具。统计每个词出现的次数,并给出排名、数量和百分比。支持停用词过滤、Top-N 显示以及导出完整表格为 CSV。. 完全在浏览器中运行 — 无需注册,无需上传。

分类
开发者
价格
免费
隐私
基于浏览器
注册
无需

隐私

除非另有说明,否则你的数据永远不会离开浏览器。词频统计工具 完全在客户端运行 — 无需上传服务器,不记录日志,不追踪你输入的内容。

操作指南

相关工具

在 Zerethon Social 上创作、分享与成长

免费注册。赚取积分,收集成就,与全球创作者建立联系。

免费试用 Zerethon