快捷导航
        你们的应用举例那里,“帮一个弱智儿童买的,能基本使用不错了”,为什么能够自动归结为“易用” 他的全本小说网里没有出现过完整的易用这个词


        举报 使用道具
        | 回复

        共 3 个关于本帖的回复 最后回复于 2020-3-31 16:21

        沙发
        lan_1985 金牌会员 发表于 2020-3-31 14:51:07 | 只看该作者
        易用是二级属性分类了,二级属性是对标签词的再次归类,这个是由人工整理和统计的
        举报 使用道具
        板凳
        Fuller 管理员 发表于 2020-3-31 15:15:37 | 只看该作者
        为了做一个分析报告,通常会做两次分类,第一次用软件自动做,第二次基于第一次人工进行调整。这样才能确保精度。因为自动软件是无法准确识别自然语言的,都是根据概率进行估计的,当遇到网络上的很自由的语言表达,尤其含有一些隐喻的时候,就不可能正确处理,这时候就需要人工进行标定。

        如果使用集搜客分词软件,那么导出excel格式的分析结果以后,在excel中进行纠正
        举报 使用道具
        地板
        远大贾丽 初级会员 发表于 2020-3-31 16:21:09 | 只看该作者
        谢谢,明白了,确实提高了准确度,不错的一款工具。
        举报 使用道具
        您需要登录后才可以回帖 登录 | 立即注册

        精彩推荐

        • 如何使用集搜客分词平台做社会网络图分析?
        • 关于食品安全的美国联邦法规文件的网络爬虫
        • 怎样更有效率地搜索互联网和整理知识—使用
        • 阿里巴巴外包询价网站用集搜客网络爬虫能采
        • 在限定论域的时候,为什么“任何一个”表示

        热门用户

        GMT+8, 2020-5-31 12:15