当前位置:首页 > 软件下载 > 教育教学

LABB-CAT(语言学研究工具)v20210216官方版

点此纠错

  • 平台:WinAll
  • 大小:210M
  • 语言:英文
  • 类别:教育教学
  • 授权:免费软件
  • 更新:2025-03-09
5.0
0% 0%

情介绍

LABB-CAT 是一种基于浏览器的语言学研究工具,可存储音频和正则表达式可搜索的采访笔录、搜索结果、整个笔录和媒体,可以以多种格式查看或导出。

LABB-CAT 是一种基于浏览器的语言学研究工具,可存储音频和正则表达式可搜索的采访笔录、搜索结果、整个笔录和媒体,可以以多种格式查看或导出。

LABB-CAT(语言学研究工具)

特征

媒体和笔记本存储

LaBB-CAT 本质上是音频/视频记录的时间对齐转录本的存储库。可以使用Transcriber、Praat 或ELAN 生成时间对齐的转录本(可用于创建将转录本文本与音频/视频记录中的相应位置对齐的文件)。然后将转录内容上传到LaBB-CAT,以便存储有关说话者和转录内容的附加信息。

来自Transcriber、Praat 或ELAN 的文字记录。

征求意见任务

您还可以定义启发任务,包括提示参与者阅读并回答问题。

当参与者完成任务(使用浏览器或移动设备)时,他们的语音将被记录并自动直接上传到LaBB-CAT。

自动标注

例如,结合信号数据、原始正字法转录以及一些第三方数据和工具,可以对转录进行自动注释。

词汇标签

来自CELEX 的注释利用来自CELEX 的数据,可以使用更多数据自动注释单词。

语音学

教学大纲

形态学

语气

频率

还可以集成其他词典,包括CMU 发音词典和Unisyn 词典。

力对齐

在HTK 或WebMAUS 的帮助下,可以强制在句子级别对齐的转录本在单词和段落级别进行对齐。

强制与HTK 对齐

统计层

LaBB-CAT数据库本身的词频数据可以直接计算并标注每个词。

词频层

语言查询和字数统计(LIWC)可用于将语料库与参考语料库进行比较。

LIWC比较

结合CELEX的时间排列信息和音节数,可以计算出不同领域的语速。

每分钟的音节数、行数和轮数的音节数

斯坦福解析器

在斯坦福解析器的帮助下,可以为成绩单生成可编辑的语法树。

跨句法组件的注释。

解析树表示

脚本

可以用Python或Javascript编写脚本来执行任意计算和注释任务。

用于计算双变异指数的Python脚本

IBM Watson 人格洞察

LaBB-CAT 可以与IBM Watson 的Personality Insights Web 服务集成,对转录本执行个性分析。

手动标注

可以手动添加评论,例如

井号

单个单词的文本标签

时间点或间隔可以使用Praat 进行注释。

使用Praat 标记点

搜索

一旦转录本和注释就位,就可以在转录本中搜索满足特定标准的转录本(例如,基于说话者的年龄/性别、转录本所属的语料库等)。

按属性过滤发言人

当选择发言人时,可以在不同层中搜索他们的陈述,寻找文本或一般表达。

在“成人”主题中搜索“the”,然后在音素级别搜索以I、E、i 或@ 开头的单词。

这将返回所选记录中与查询匹配的所有语句的列表。

搜索结果

如果需要,可以将此列表以及相关演讲者和注释信息直接导出到csv 文件,以便在Excel 或R 中进一步分析。

搜索结果

或者可以提取音频样本进行分析。

从结果中提取音频

或者您可以直接使用EMU-webApp编辑语句注释和对齐方式。

使用EMU-webApp 编辑电话对齐。

如果语句已经强制对齐,可以使用Praat批量处理目标段。

使用Praat 进行批量处理以提取形式和其他声学测量值。

批量Praat 处理可以包含您自己的自定义Praat 脚本。

用于批量处理搜索结果的定制Praat 脚本。

此外,单击搜索返回的声明将生成演讲者的完整文字记录,与相关声明一起放置在屏幕顶部。您可以单击脚本的任何部分并播放媒体的相应部分。

互动转录

直接从交互式转录页面播放媒体、显示附加注释层、提取该行的音频,或在Praat 中打开包含注释的相应TextGrid。可以添加、编辑或删除注释,并调整对齐方式。