最新推荐
-
数学编辑器(Math-o-mir)V1.81绿色中文版 教育教学 / 2.3M
-
清成排课软件课表管理系统v6.4.0.0 教育教学 / 4.8M
-
好好算v1.0绿色版 教育教学 / 273KB
-
四等水准口算天天练v1.0绿色版 教育教学 / 141KB
-
新梦想考试卫士v2.2绿色版 教育教学 / 5.1M
精品推荐
-
灯果写作v3.0.1官方版 教育教学 / 106.4M
查看 -
中小学图书管理系统v2.0官方版 教育教学 / 3.8M
查看 -
出题大师-小学数学版v1.1.3.1官方免费版 教育教学 / 6.8M
查看 -
几何图形计算v1.0.1.3绿色版 教育教学 / 179KB
查看 -
随身课堂老师端v2.7.2.3官方版 教育教学 / 28.5M
查看
本类排行
详情介绍
LABB-CAT 是一种基于浏览器的语言学研究工具,可存储音频和正则表达式可搜索的采访笔录、搜索结果、整个笔录和媒体,可以以多种格式查看或导出。
LABB-CAT 是一种基于浏览器的语言学研究工具,可存储音频和正则表达式可搜索的采访笔录、搜索结果、整个笔录和媒体,可以以多种格式查看或导出。
特征
媒体和笔记本存储
LaBB-CAT 本质上是音频/视频记录的时间对齐转录本的存储库。可以使用Transcriber、Praat 或ELAN 生成时间对齐的转录本(可用于创建将转录本文本与音频/视频记录中的相应位置对齐的文件)。然后将转录内容上传到LaBB-CAT,以便存储有关说话者和转录内容的附加信息。
来自Transcriber、Praat 或ELAN 的文字记录。
征求意见任务
您还可以定义启发任务,包括提示参与者阅读并回答问题。
当参与者完成任务(使用浏览器或移动设备)时,他们的语音将被记录并自动直接上传到LaBB-CAT。
自动标注
例如,结合信号数据、原始正字法转录以及一些第三方数据和工具,可以对转录进行自动注释。
词汇标签
来自CELEX 的注释利用来自CELEX 的数据,可以使用更多数据自动注释单词。
语音学
教学大纲
形态学
语气
频率
还可以集成其他词典,包括CMU 发音词典和Unisyn 词典。
力对齐
在HTK 或WebMAUS 的帮助下,可以强制在句子级别对齐的转录本在单词和段落级别进行对齐。
强制与HTK 对齐
统计层
LaBB-CAT数据库本身的词频数据可以直接计算并标注每个词。
词频层
语言查询和字数统计(LIWC)可用于将语料库与参考语料库进行比较。
LIWC比较
结合CELEX的时间排列信息和音节数,可以计算出不同领域的语速。
每分钟的音节数、行数和轮数的音节数
斯坦福解析器
在斯坦福解析器的帮助下,可以为成绩单生成可编辑的语法树。
跨句法组件的注释。
解析树表示
脚本
可以用Python或Javascript编写脚本来执行任意计算和注释任务。
用于计算双变异指数的Python脚本
IBM Watson 人格洞察
LaBB-CAT 可以与IBM Watson 的Personality Insights Web 服务集成,对转录本执行个性分析。
手动标注
可以手动添加评论,例如
井号
单个单词的文本标签
时间点或间隔可以使用Praat 进行注释。
使用Praat 标记点
搜索
一旦转录本和注释就位,就可以在转录本中搜索满足特定标准的转录本(例如,基于说话者的年龄/性别、转录本所属的语料库等)。
按属性过滤发言人
当选择发言人时,可以在不同层中搜索他们的陈述,寻找文本或一般表达。
在“成人”主题中搜索“the”,然后在音素级别搜索以I、E、i 或@ 开头的单词。
这将返回所选记录中与查询匹配的所有语句的列表。
搜索结果
如果需要,可以将此列表以及相关演讲者和注释信息直接导出到csv 文件,以便在Excel 或R 中进一步分析。
搜索结果
或者可以提取音频样本进行分析。
从结果中提取音频
或者您可以直接使用EMU-webApp编辑语句注释和对齐方式。
使用EMU-webApp 编辑电话对齐。
如果语句已经强制对齐,可以使用Praat批量处理目标段。
使用Praat 进行批量处理以提取形式和其他声学测量值。
批量Praat 处理可以包含您自己的自定义Praat 脚本。
用于批量处理搜索结果的定制Praat 脚本。
此外,单击搜索返回的声明将生成演讲者的完整文字记录,与相关声明一起放置在屏幕顶部。您可以单击脚本的任何部分并播放媒体的相应部分。
互动转录
直接从交互式转录页面播放媒体、显示附加注释层、提取该行的音频,或在Praat 中打开包含注释的相应TextGrid。可以添加、编辑或删除注释,并调整对齐方式。