Abstract:灰常全面的SPSS 学习笔记 ~
// 最近传播统计学课程要进行 SPSS 实操了 w
Abstract:2018年3~4月找AI PM暑期实习和面试经验总结 ~ 大概花了1~2周,面了几家公司,拿了商汤和旷视的AI PM实习offer(开心辣)
摘要:中文分词是中文信息处理的重要基础,本文详细阐述了目前主要的几种中文分词算法的技术原理 、中文分词目前的瓶颈和评价准则,以及中文分词的具体应用。
中文分词指将一个汉字序列切分成一个个单独的词。现有的中文分词算法有五大类:基于词典的方法,基于统计的方法,基于规则的方法,基于字标注的方法,基于人工智能技术(基于理解)的方法。中文分词目前主要有四个瓶颈,分别是分词歧义、未登录词识别、分词粒度问题、错别字和谐音字规范化。中文分词有五大评价准则:分词正确率,切分速度,功能完备性,易扩充性和可维护性,可移植性。中文信息处理包括三个层次:词法分析,句法分析,语义分析,其中中文分词是词法分析的第一步,非常重要。中文分词是大部分下游应用的基础,这些下游应用小到POS词性标注、NER命名实体识别,大到自动分类、自动摘要、自动校对、语言模型、机器翻译、搜索引擎、语音合成等等。
摘要:本文基于桑斯坦的“信息茧房”理论,以今日头条为实例,研究新媒体时代下算法推荐带来的“信息茧房”效应。在此基础上剖析了今日头条的“信息茧房”效应的具体成因以及危害,并给出规避这种危害的建议。
摘要:本文以产品的角度观ofo全局,从产品本身、用户需求、产品解决方案、产品运营、商业模式、未来发展策略六个维度去分析以ofo为代表的共享单车得以快速成长背后的原因。
Abstract:今日头条以推荐算法为引擎在内容领域表现强劲,且其产品从单纯的新闻客户端演变成较大的产品矩阵,内容结构不断完善,可见头条正向综合性信息媒体平台方向发展,甚至其可能更大的野心是做未来互联网的入口。不过,从前坚持“算法至上”的头条,在经历被人民网点名批评和“约谈”后开始采取多项举措力图解决其平台上色情低俗内容泛滥的问题。至于这些举措的效果如何,且待时间检验。