手机浏览器扫描二维码访问
【我将《红楼梦》分为两部分,第一部分:前80回,第二部分,后40回。
在经过我缜密而繁复的研究工作后,我发现了一个惊天的秘密——《红楼梦》后四十回,其作者并不是曹雪芹,而是由后人续写,狗尾续貂之作。
】
抖乐最近学习了其他短视频网站,开通了弹幕功能。
此时满屏幕的弹幕全是问号。
“???”
“啊???”
“三无,请回去写你的诗词吧,别在这逗我好么?”
“这不扯淡呢么?”
“现在的自媒体,为了流量真是啥瞎话都敢编啊!”
……
视频内容继续:
【接下来的一段时间里,我将分若干集,从各个角度出发,来论证《红楼梦》后四十回并不是曹雪芹手笔。
而本集视频,我们先从文本特征差异研究开始。
我将运用统计学方法,并结合R语言技术,对我的观点进行阐述!
】
弹幕上,网友们又蒙圈了。
“R语言技术?统计学?跟《红楼梦》有什么关系?”
“什么是R语言?”
“这不是文学方面的事情么?怎么涉及到数学和计算机技术了呢?”
“对啊,文学就是文学,怎么能和其他学科混为一谈呢,一看就不靠谱!”
“继续围观,看这个诗人能扯出什么花样来。”
……
【在大量事件的前提下,无论是在语言表述,还是在写作中,每个人在特定情况下用字或是用词都存在着某种规律。
这种规律便是个人在说话与写作中所形成的语言表达习惯,即是个人在其特定习惯中所形成特有的文体特征。
所以,不同的作者在用词频率与用词风格上存在一定的差异性。
我将运用R语言对《红楼梦》著作进行文本分词和词频统计,从高频词汇和虚字两个研究角度,来分析《红楼梦》前八十回与后四十回在文本特征上的差异性。
首先,我们率先研究高频词汇。
在《红楼梦》的高频词汇中,我首先将人名、地名、称谓等剔除掉,以及对“一个”
“一面”
等表数量的没有实际意义的词汇进行剔除。
于是,我们得到了65个高频词汇进行文本研究,现制作统计表格。
如下图!
】
短视频中,贴出一张统计表。
【高频词汇研究对象表】
【1,什么;2,我们;3,那里;4,姑娘;5,你们……63,家里;64这话;65到底。
】
很显然,这是跳舞的又一套新书。也将会是跳舞在起点的第五套全本。(注意,这本书是都市YY,呵呵。几乎没有什么神话色彩,更不会再有什么教皇教会宗教圣骑士吸血鬼玉皇大帝之类的东西了)...
丧尸出现后的第五天,我被强行赶出了宿舍楼,意外变成了介于丧尸和人类之间的存在,救生之路,就此开始。...
...
穿越到火影世界,成为木叶三大家族之一日向分家的人,白眼发生变化,获得了内视的能力在内视状态下拥有主宰体内的一切的能力偶然间发现先祖的秘密,从此走上和六道仙人不同的路新书从给鸣人治病开始已经上传!喜欢的可以关注一下。。...
一纸契约,他们闪速结婚。他宠她,疼她,让她成为天下所有女人艳慕的对象。当她拿着怀孕化验单,满脸幸福地站在他面前时,他却递上一张离婚协议书。她没要他给的天价补偿,净身出户。五年后,她挽着未婚夫挑选婚纱时,他忽然出现,将她拽到身边,霸道地说,老婆,我儿子说了,不想要后爹。...
被继妹下药送给陌生男人,却不想惹上高冷霸道的沈三少。坊间传闻,沈三少又瞎又瘸,还心理变态!她对他避如蛇蝎,他却宠她入骨,爱她如命。没有人知道,被吃人不吐骨头的老公宠到爆,到底有多伤身!乔雪鸢扶着酸痛...