考拉阅读:做国内首个中文分级阅读系统

来源 :风流一代·TOP青商 | 被引量 : 0次 | 上传用户:zj5536
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在一批在线教育试水者当中,赵梓淳带领的考拉阅读有点不太一样。因为国内做分级阅读的虽然不多,但是做中文分级阅读,目前仅有他们一家。
  在线教育这个领域,考拉阅读算是新人——成立不足1年,团队满60人,刚完成新一轮融资。在创始人赵梓淳眼中,阅读教育是一项非常庞大的产业,AI+教育的未来仍存在很多不确定性。考拉阅读也还处于摸索阶段。
  为什么要做中文的分级阅读标准?
  事实上,在国内,如好未来、VIPkid等一些在线教育企业已经在做英文的分级阅读,虽有其物,但一直没多大水花。赵梓淳透露,对于考拉阅读来说,做英语的分级阅读标准并没有太大的技术难度,但他们并不想做。


  原因很简单,国外已有一套很成熟的英文分级阅读标准系统,不仅运行了将近40年且已覆盖了美国90%的学校,如Lexile分级(蓝思分级)、GE分级等。而在国内,中文阅读不仅连分级标准都未建立,很多教师甚至连分级阅读都没听过,尤其是在重要的基础教育领域,很多书店给童书分级,只能给出诸如“适合8岁以下孩子阅读的童话书”等基于感性、经验基础的文字建议。此外,教师、家长对孩子阅读水平的了解也一直处于空白状态,因为获取这一数据的渠道不是没有,而是非常有限。
  在这两大刚需的驱使下,再加上全民阅读、全面二孩等相关政策的颁布,以及人工智能、机器学习和大数据的发展,又给前者提供了更充分的条件,这一切都让赵梓淳觉得:做一套中文分级阅读标准很有必要,而且,时机也来了。
  瞄准AI,建立中文分级阅读系统
  考拉阅读首席技术官任易透露,在欧美,英文的分级阅读主要有两个维度:语义,主要看词频,如果一个单词出现的频次很低,则系统会判定这个词相对较难。句法,主要看句子长度,长句一般较难去分析和理解。而句子难度跟从句、副词、介词等的使用也密切相关。
  在这两个维度上,欧美国家通过统计学的方法来完成分级阅读标准的建立。任易表示,考拉阅读的中文分级阅读标准借鉴了国外“词、句”的分析思想,因而和其有一定的相似性。但是,由于中文相较英文的“天生复杂性”,决定了考拉阅读必须做得更加深入。


  据赵梓淳介绍,中文和英文的三大本质区别主要在于:一是基础单元,英文的基础是26个字母,中文的常用汉字达3500个,这就决定了中文阅读的分析必然需要一个规模化的语料库;二是分词,英文不需要分词,仅需空格即可判定词语的边界,但汉字脱离不了分词。如“量子自旋效应”这个词,有人可以将其分为“量子”“自旋”“效应”三个词,也有人认为这就是一个词,但在英文中就无此类困扰;三是句式结构,英文的句式结构要严谨得多,如主从句之间会有that、which、what等来界定。中文的行文风格则较为随意,嵌套结构也要混乱得多。
  鉴于这三大区别,考拉阅读基于ER Framework的分级阅读标准在“词”“句”的基础上再加入“字”“段”“篇”三个维度,即从“字词句段篇”五大维度提取几十个特征来表达中文的难度,并实现段落、主题等的分析。
  赵梓淳介绍,他们一共处理了几百万字的非平衡语料库和几亿字的平衡语料库。考拉阅读的非平衡语料库主要来自各个版本的小学教材及其教辅资料,其是指垂直于某一品类的语料库,如小说、历史传记各有其对应的语料库;平衡语料库即指一个孩子在日常生活中需要真实接触的语料,如,按照一个10岁小孩需要看20%的名著小说、50%的课文和20%的漫画这种比例来配语料库。
  “因为中文的句子相较英文要复杂得多,机器在理解中文的第一步就会遇到词性分析、语言模型上的困难。所以,有赖于现在流行的AI技术。”任易表示,“现在我们可以做到,将一个句子按照句法树、依赖关联等予以拆解,以分析每一个成分在句子中的比重,从而实现阅读文本的难度分级。”
  而区别于欧美英文分级阅读,考拉阅读的分级阅读系统最大的优势即在于AI在此发挥的作用。赵梓淳透露,随着用户数量的增加,产生的数据越多,该系统中的模型可实现自主学习,不断优化,从而对文本阅读的难度感知越发准确。
  从上至下 走To B路线
  据了解,目前赵梓淳带领其团队共开发了三款产品:基于ER Framework的个性化分级阅读系统、基于ER Framework和“新课标”的阅读能力测评以及针对公立学校的阅读整体解决方案,包括教师培训、分级短文材料等。其中,考拉阅读的分级阅读系统现在已经进入天津市200余所中小学,被全市上百万的小学生使用。赵梓淳称,考拉阅读的用户群主要为小学阶段的孩子,目标是利用AI和语言学的结合,全面提升这些孩子的阅读能力。
  在公司战略决策的制定上,赵梓淳显得非常冷静而果断,其称,考拉阅读的业务从一开始就是围绕To B在展开,不会针对C端使用。原因有两点:
  1.普通民众并不明白什么是分级阅读。对于考拉阅读这种体量的创业公司而言,要转变他们对分级阅读的认知,任务实在过于繁重。所以,更好的方式就是在一开始就从To B端的公立学校、教育机构去切入,让教育局、教师等为分级阅读背书,且还能增强公司产品的公信力。
  2.目前获取C端用户的成本依然很高。基于此,赵梓淳表示,“所以我们还是想在B端稳扎稳打下去。后期公司发展到一定程度之后,必定会走向To C端,毕竟To B的天花板一定是可以预见的”。
  目前,考拉阅读已经成功牵手200余所中小学,但在在线教育这一慢热的市场,特别是在很多教育资源都被政府等相关机构紧紧攥在手里的情况下,考拉阅读又是如何打通这些壁垒,和这些中小学成功牵手的呢?
  趙梓淳说,事实上,考拉阅读一开始走这条路也不太顺利——最先采取对每家学校进行单点突破的方式,效率非常低下。赵梓淳带领其团队观察到这样一个现象,国内很多中小学都很重视学生的测评,但在阅读能力的测评上却处于相对空白的状态。于是,考拉阅读联合北京师范大学基础教育评测中心做了一件大事:在国内一线到四线城市,对近10万学生进行了基于ER Framework和“新课标”的阅读能力测试,并对相关数据进行分析,最终出具了一份中国学生的阅读能力量表。在测评的助攻下,考拉阅读成功打通了和中小学合作的路径。
  开设教师培训课程
  同时,在推进分级阅读标准的过程中,考拉阅读发现教师是整个推进过程的关键角色。因为虽然已经开发出中文分级阅读标准及其配套工具和产品,但在赵梓淳看来,这些工具和产品依然需要人来使用,需要教育者来向这些孩子传递教育的温度和理念。但是,国内教育理念跟不上,语文教师对整个前沿教育的趋势掌握不到位……这些都是问题。
  针对这一痛点,考拉阅读还和学校合作开展了20课时和40课时不同版本的针对教师的培训课程,由其团队里具有深厚教研经验的成员进行研发,分为线下集中辅导和线上远程支持两种路径,以培训教师们及时更新各种新兴教育理念的能力,从而及时掌握教育阅读的最新发展趋势。
  总的来说,“分级阅读系统只是一种工具,它并不能喧宾夺主取代老师。我们做分级阅读的意义就在于,想告诉家长和老师,哪种文本难度的书目是适合你的孩子或学生去阅读的。至于读还是不读,依然需要家长和老师去做出判断。”赵梓淳坦言。
其他文献
前段时间,记者听到了一个新词,叫“形商”。听说过情商、智商,还真不知道何谓“形商”。原来,这是指一个人管理自己身材的智力商数。一般来说,能够通过各种方法控制好自己身材的人,其“形商”更高。也就是说,看一个人的身材,就可知道他的修养、意志力和对人生规划的管理控制能力。  不只是“形商”,还有“颜值”。类似这样,直白地道出“我就是看重外在美”似乎成为当下年轻人的一种宣言,展示出他们释放真性情、表达个性
期刊
拍照必美颜,出门必化妆,是许多人的生活习惯。爱美之心,人皆有之,在这个强调颜值的时代,“美”的重要性不言而喻。不同于如今火爆大江南北的医学美容,生活美容已经是美容经济中的“老兵”,二十多年来,见证了中国美容业态的兴起与发展,也逐渐成为众多爱美人士生活中不可或缺的部分。  越来越多的女性这样打发自己的业余生活:工作日,在职场上披荆斩棘;下班后或者周末来到国色天香金陵超妍(下文简称金陵超妍)。在这里,
期刊
相比于羽毛球、乒乓球、游泳等项目,网球市场一直以来相对小众。但随着网坛美女李娜、莎拉波娃、库尔尼科娃们的精彩展示,越来越多的人喜欢上了这项充满美感和韵律感的体育项目。  南京众健星火网球俱乐部(下文简称众健星火)正是看准了这一趋势,开始布局网球市场。从2015年正式创立算起,众健星火走过了两年多的时间。这两年多来,众健星火在几位创始人的共同努力之下,走得风生水起,在业内拥有了一定的知名度,且公司规
期刊
互联网时代有三拼,“颜值不行拼人品,人品不行拼情怀”,颜值当之无愧居首。但事实总是残酷的,在颜值当道的当下并不是人人都天生丽质,加之“没有最美,只有更美”的心理,催生出强大的颜值消费力。  颜值经济崛起  根据尼尔森的调查,全国女性平均护肤时间28.3分钟/天,超过57%的女性表示有化妆习惯;男性平均护肤时长是24分钟/天,比女性仅少了5分鐘不到,有22%男性受访者表示在日常生活中会化妆,化完妆还
期刊
颜值(beauty index)是指一个人的长相、体形、性征、皮肤、音质等身体禀赋的组合所带来的吸引力,这种吸引力具有巨大的价值。在中国有“恸哭六军俱缟素,冲冠一怒为红颜”的掌故,在西方有特洛伊之战的不朽史诗。颜值高的美人往往是国家兴衰的导火索,难怪古人形容颜值高的美人为“倾国倾城”。  颜值体系最早发轫于5.3亿年前的寒武纪,通过为物种的异性繁殖提供最丰富、最节约成本、最精确的基因优选工具,掀起
期刊
前不久,南京发生了一起由医疗美容引发的事故:一名23岁的年轻女孩,因为爱美打了一针玻尿酸,差点导致一只眼睛失明,后被送到南京一家医院眼科进行抢救。通过眼科、神经内科、高压氧等科室的通力协作,情况才有所好转。  人们在打玻尿酸之前,大多知道会有一定的风险,但是,“明知山有虎,偏向虎山行”。笔者曾经采访过一个热衷微整形的女孩,她说,“通过医美进行微整形是非常普通的事,這就像学生上补习班一样,成绩落后通
期刊
这些年,冬日里的雾霾是国人挥散不去的痛。那是一种呼吸着的痛,避之不及,人们唯有用各种手段去提防着它的侵袭。在强大的需求背后催生出新的市场——雾霾经济。针对雾霾,各式各样的口罩出现在市场上,但真正能让消费者心动的却少之又少。除却功能,几无所长,人们只是无奈地使用着,谈不上喜欢,聊胜于无。身为设计师,Aetheris巽一电子科技创始人Chris Hosmer用“人性化设计”重新定义雾霾天里必不可少的口
期刊
2017年11月,兰世立控诉他人骗取百亿资产从而引发轩然大波,随即广州警方发布信息称,“严正敦促犯罪嫌疑人兰世立立即停止不法行为,主动向公安机关投案自首”。此前,兰世立辞去公职创业,打拼到身家数十亿成“湖北首富”,继而因犯逃避追缴欠税罪获刑4年,从创业榜样沦为负面案例。现如今,再度创业已有一些收获的兰世立原本可能变为正面教材,却因涉嫌犯罪可能再次成负面案例。《中共中央国务院关于营造企业家健康成长环
期刊
魏晓媚是两个女儿的母亲,自诩有“三个孩子”。一次偶尔帮助朋友做母婴类视频策划案,让她创立亲子类视频专业平台——“奇育记”。在对“三个娃”无微不至的关怀过程中,她的人生也在不断地丰盈。  打开那扇窗  出生于黑龙江的魏晓媚,本科毕业于中国传媒大学影视艺术学院摄影专业。大四时,她作为交换生赴美国学习娱乐产业管理,在奥兰多迪士尼参加国际大学生实践项目。回国后,她被保送上海大学攻读艺术产业管理硕士专业。研
期刊
“农夫市集”在国外已经是比较普遍的实体零售市场,它聚集了来自城市周围的农场生产者,让农户能够跳过中间商环节与消费者直接交易。本着这样的理念,5年前,台湾姑娘Erica黄莉莉辞去了新媒体主编的工作,在北京创立了“从农场到邻居F2N market(简称F2N market)”农夫市集。除了集结了一批本地农场外,市集上还出售加工美食、原创手工和环保日用品等。  从艺术专业毕业生到新媒体主编  Erica
期刊