网站首页 > 科技论文> 文章内容

论文灌水有了人工智能神器 施颜程序类科研专家还能干什么? 这智能撰文机将带来什么

※发布时间:2017-11-22 11:41:24   ※发布作者:habao   ※出自何处: 

  原标题:论文灌水有了人工智能神器, 施颜程序类科研专家还能干什么? 这智能撰文机将带来什么......

  本平台推出文稿均出于非商业性的教育和科研目的,旨在学术研究信息、净化大学教育与科研生态。但声明该文仅代表原作者的个人观点并不意味着本号赞同其观点或其内容的真实性。如有或侵权,本平台将在第一时间处理。期望读者关注点赞《蝌蚪士》公益事业: 为苦逼科民发声、并贡献的智力;且为平民大众免费科普,使之走进科学、传承科学、壮大科学——人人都能成才实学的蝌蚪士 (主编 赛德夫).

  本周,我们收到了一篇新闻稿引起了我们注意:一家公司正在发布软件,声称其能将研究人员的数据写成文章。

  开发这款软件的sciNote LLC公司表示,这个被称为“写手”的程序使用人工智能(AI)制造论文。一位发言人解释说,这个软件只会提供初稿供科研人员修改,而不会把讨论(Disscuss)这个“科学文章中最原创的部分”写出来。让人好奇的是这款软件是否能够产生连贯的文章?

  “...能够利用机器学习和人工智能的技术进步,大大简化编写科学论文的过程。我们认识到全球科学界及时公布科学研究的重要性,因此我们软件的目标是大大缩短准备初稿的时间。通过实验室电子记录系统(ELN)中包含的数据和从获取期刊中获取的参考文献,为作者提供一个有初步结构的草稿,然后供作者进行编辑和进一步开发。

  如何避免“论文工厂”会有时出现的问题,比如抄袭?我们采访了Charles Seife,其在纽约大学工作且有着调查“论文工厂”的经验。 Seife说,他不能根据经验对“写手”评论,因为他没有在自己的电脑上安装这款软件,但它似乎很“狡猾”。

  “我能够想象这样一个有用的系统,它会带上实验笔记,并试图将数据,程序和笔记合并到各种模板中;帮助附上参考文献;甚至为一篇论文数据创建一个摘要。然而这个系统比这些更有前景,这个软件能直接提供一个“初稿”。对我来说,只要科研工作者创作大量的文章,这个程序就能获取它…这在某种程度上是有问题的。

  服务条款明确表示,初稿不仅会由用户存储的数据产生,还会由“相关关键字和数据库中参考文献”产生。显然,人工智能很难像人类一样理解和消化论文,所以我很难看到它如何在文献的基础上创建非抄袭或连贯的作品。

  “我自己没有使用过这个程序,我不能肯定,但是我愿意相信,它是从参考文献的引言中抓取段落,以某种方式弄虚作假,然后把它提供给研究人员去在他自己的引言中使用。这显然不是一个好主意。

  所以,是的,这个商业模式关系到我。如果它实际上帮助窃取别人的文章,轻微地修改它,然后将其当做自己的使用,那么这是一件的事情。

  ““写手”将根据科学家的项目和sciNote中的实验数据,程序和笔记,生成初稿的材料和方法部分...除此之外,“写手”将根据科学家选择和输入的相关关键字和文献编号生成一个引言(Introduction)。“写手”将从选定的参考文献中提取信息,并根据相关关键字查找其他相关的参考文献,并将其纳入草稿中。科学家将得到一个引言,每个句子或段落都有一个引文,所有的论文都被添加到参考文献中。

  “在引言中的每个段落后面,科学家会看到引用的参考文献的数量和百分比(例如100%),这表明科学家从指定的参考文献中引用了特定的段落,并且是100%相同的文本。这些信息是不容忽视的,因为它是文本的一部分,并通知科研工作者应该编辑它...然后他们的责任就是编辑和校对文本。就像写作稿子的情况一样。

  我们还通知科学家在收到草稿时编辑收到的文本。主要的好处是,“写手”可以将与手头主题有关的有趣的段落包括在引言中,并在写作时给科学家一个好的开始。

  ““写手”的目的不是代替科研工作者写终稿,其目的是帮助科研工作者。这就是为什么它不能写出讨论(Disscuss)部分,这是科学文章中最有创意和最原始的部分,而这很大程度上取决于科研工作者的风格和思维方式。每个科学家都将自己的专业知识和见识添加到整个文章中。

  “该产品似乎是适合维持“出版机器”——发表或预印。许多大学和研究机构正试图摆脱这种模式。今天,有许多途径可以使研究被大家接受,例如数据库和一系列预印本服务。最重要的是,研究需要背景,我不知道这个工具是否能够或应该提供必要的人力参与产生研究报告。

  他补充说,他不知道其他公司能否提供类似的产品,但其他公司尝试过电脑生成文章。例如,一家公司(Automated Insights)生成过关于体育和企业收益的新闻报道,这些报道往往具有特定的结构,他说:

  而人工智能的最大优势就是会不走样地套用一些定律和格式,因此在一个句子里重复出现常用的词语恐怕是人工智能软件所写论文在所难免的。

  难怪《撤稿观察》这么早就对这个会写论文的人工智能软件这么关注,或许它已看到未来它不停发更多因“抄袭”而被撤稿的观察文章。

  笔者惊奇地看到,开发该论文撰写神器的公司竟然声称:“The program checksfor plagiarism”(程序会检查有无抄袭)。

  如果说这论文写手从科学家自己的研究计划、实验数据、试验方法和记录产生论文的材料与方法部分还算有所原创的话,从文献中产生引言部分不靠抄袭还靠杜捲不成?

  不过,有些“科学家伙”的论文其实早就了固定的模式,甚至于固定的语言。对于这类“科学家伙”来说,再让它们重复“写作”同样的语言为新的论文,恐怕还是对人类智慧的一个“浪费”。

  所以,这类“科学家伙”或许还真会喜欢这样的人工智能论文写手,而且花点“小钱”买个这样的软件或许还是值得的,如果这个人工智能论文写手能把写一篇论文的时间由三天缩短为一天,那在CNS那样的顶尖发表论文的原创性领先就可能有得不得诺的天地差别。

  强烈,不!应是强烈要求所有“双一流”的中国大学都抢先购买这一高科技的人工智能论文写手,用机器收集数据可以马不停蹄、加班加点,数据出来了卷写论文可不能有半点时间的耽搁。英语不好不用再怕了,有这人工智能论文写手在手,牛文辈出的时代来临了!

  但是,高兴之余笔者还是有一丝忧愁:如果数据由程序控制的机器产生了,论文也由人工智能论文写手写好了,那一公类的科学家伙还能干什么?

  作为一个科研工作者,在国际学术期刊上发表科研论文是与同行交流、取得国际影响的必经之。有些国内的科学家,实验做得很漂亮,但常常苦恼于论文写作。本文从博主的亲身体验出发,谈谈论文写作,希望能给博士生、博士后、以及年轻的课题组负责人提供一个借鉴。

  上大学时,我的英语不算好(英语四级考试仅为“良”),写作尤其糟糕。初到美国,对英文适应地很差,读一篇JBC的文章要五、六个小时,还常常不理解其中一些关键词句的意思,心里压力极大。

  学会照葫芦画瓢。没有人天生会写优秀的科研论文,都是从别人那里学来的。学习别人的文章要注意专业领域的不同,有些领域(包括我所在的结构生物学)有它内在的写作规律。科研文章里的一些话是定式,比如“To investigate the mechanism of …, weperformed…”,“Theseresultssupport the former, but not the latter, hypothesis …”, “Despite recentprogress, how … remains to beelucidated …” 等等。用两次以后,就逐渐学会灵活运用了。在向别人学习时,切忌抄袭。在美国一些机构,连续7个英文单词在一起和别人的完全一样,原则上就被认为抄袭(plagiarism)。

  如何提高英文的科研写作能力作者施一公已有 245335 次阅读 2010-8-4 14:58个人分类:未分类系统分类:科研笔记

  作为一个科研工作者,在国际学术期刊上发表科研论文是与同行交流、取得国际影响的必经之。有些国内的科学家,实验做得很漂亮,但常常苦恼于论文的写作力不从心,成为国际交流的一大障碍。本文从博主的亲身体验出发,给博士生、博士后、以及年轻的PI提供一个借鉴。文章最后做简短总结。

  我大学时的同班同学都知道,那时我的英语不算好(英语四级考试仅为“良”),写作尤其糟糕。初到美国之时,对英文适应得很差,读一篇JBC的文章要五、六个小时,还常常不理解其中一些关键词句的意思,心里压力极大。

  很幸运,我在约翰霍普金斯大学(JohnsHopkins University)攻读博士学位时,1991年4月遇到了学兄和启蒙老师John Desjarlais。听了我的苦恼后,John告诉我,“Spend 45 minutes every day readingWashington Post, and you will be cruising with your written English in twoyears”(每天花45分钟读《邮报》,两年后你的写作能力会得心应手)。这条正合我意 - 我原本就对新闻感兴趣!于是,我每天上午安排完第一批实验后,都会在十点左右花一小时的时间阅读《邮报》,主要看A版(新闻版)。刚开始,我一个小时只能读两、三个短消息或一个长篇报道,中间还不得不经常查字典看生词。但不知不觉间,我的阅读能力明显提高,1992年老布什与克林顿竞选总统,我新闻,常常一个小时能读上几个版面的消息或四、五个长篇报道,有时还把刚看到的新闻绘声绘色地讲给师兄师姐听。

  阅读直接提升了我的英文写作能力。看完一些新闻后,我常常产生动笔写自己感想的冲动。92年巴塞罗那奥运会,中国游泳队取得了四金五银的好成绩,美国主要纷纷这是中国运动员服用违禁药物,但没有任何检测的,完全凭美国运动员的感觉。此事让我很,我生平第一次给《邮报》和《巴尔的摩》(The Baltimore Sun)各写了一封信,评论报道的不公平。没想到两天后《巴尔的摩》居然原封不动的把我的信刊登在“读者来信”栏目,同事祝贺,我也洋洋得意。受到此事鼓励,我在此后三年多的日子里,常常动笔,有些文章发表在报刊上(大部分石沉大海),也曾代表中国留学生写信向校方争取过中国学生的利益。有时还有意外的惊喜。95年的一天,一位朋友打电话告诉我:今天出版的《巴尔的摩》上有我的评论文章!我急匆匆赶到街头买来5份,果然,在A版的倒数第二页,以15x15厘米的篇幅发表了我一个多星期前寄给、本以为不会发表的一篇的文章。

  以上是简述我个人英文写作提升的一段过程。但是,科研论文不同于读者来信,有其专业特点、甚至是固定格式。1994年,我第一次完整地写科研论文,感觉很差。好不容易写完的文章,连我自己都不愿意读第二遍;勉强修改之后,交给了老板Jeremy Berg。他拖了三周没看我的文章,我实在忍不住了、去催他,上午9点,Jeremy告诉我:今天看!11点,我去他办公室催,秘书拦住我,说Jeremy正在办理重要事务,两点前不得打扰。我心里惴惴,不知Jeremy在干什么。下午一点半,Jeremy急匆匆过来找我,拿了一叠纸, “This is the draft.Please let me know what you think. We can aim for a Science report.”(这是初稿,你看看如何,我们可以试试《科学》)我仔细一看,天啊!一共7页,四个多小时Jeremy已经把文章的整体写完了,只是缺少Method和 references。让我郁闷的是,他根本没有用我的初稿。

  【其实,写文章贵在一气呵成。我也沿袭了Jeremy的风格。2006年10月,在我们处于劣势的激烈竞争中,有两个课题面临被 scoop的,我曾经两次、一晚上赶一篇文章。10月15日,傍晚8点左右开始写、通宵,第二天早晨10点完成一篇按照《细胞》格式的论文,包括abstract,introduction, results, discussion,仔细阅读一遍后于下午4点半完成网上。这篇文章最终发表在12月份《自然》的子刊《结构与生物学》上(电子版于11月10日发表)。另一篇,10月18日,晚6点开始写、通宵,第二天早晨8点完成,上午9点半完成,最终发表在12月15日的《细胞》上。当然,能通宵完成一篇文章,还有一个重要前提,就是对研究领域非常熟悉,对文章整体的大概思已经深思熟虑,所有的Figures都事先做好了。这些前期工作即使心投入也需要3-4天。】

  1.要写好科研论文,必须先养成读英文文章的习惯,争取每天30-60分钟。刚开始可以选择以读英文、英文新闻为主,逐渐转为读专业。我会在近期专门写一篇博客文章介绍一套行之有效的增强读专业能力的办法。

  2.写科研论文,最重要的是逻辑。逻辑的形成来自对实验数据的总体分析。必须先讨论出一套清晰的思,然后按照思来做图(Figures),最后才能执笔。

  3.具体写作时,先按照思(即Figures)写一个以subheading为主的框架,然后开始具体写作。第一稿,切忌追求每一句话的完美,更不要追求词语的华丽,而主要留心逻辑(logic flow),注意前后句的逻辑关系、相邻两段的逻辑关系。写作时,全力以赴,尽可能不受事情干扰(关闭手机、座机),争取在最短时间内拿出第一稿。还要注意:一句线.学会照葫芦画瓢。没有人天生会写优秀的科研论文,都是从别人那里学来的。学习别人的文章要注意专业领域的不同,有些领域(包括我所在的结构生物学)有它内在的写作规律。科研文章里的一些话是定式,比如 “To investigate the mechanism of …, we performed …”, “These resultssupport the former, but not the latter, hypothesis …”, “Despite recentprogress, how … remains to be elucidated …” 等等。用两次以后,就逐渐学会灵活运用了。在向别人学习时,切忌抄袭。在美国一些机构,连续7个英文单词在一起和别人的完全一样,原则上就被认为抄袭(plagiarism)。

  5.第一稿写完后,给自己不要超过一天的休息时间,开始修改第二稿。修改时,还是以逻辑为主,但对每一句话都要推敲一下,对abstract和正文中的关键语句要字斟句酌。学会用“Thesaurus”(同义词替换)以避免过多重复。第二稿的修改极为关键,再往后就不会大改了。

  6.第二稿以后的修改,主要注重具体的字句,不会改变整体逻辑了。前,一定要整体读一遍,对个别词句略作改动。记住:学术期刊一般不会因为具体的语法错误一篇文章,但一定会因为逻辑混乱而一篇文章。

  这套方法行之有效,我对所有的学生和博士后都会如此。我的第一个博士后是柴继杰,1999年加入我在普林斯顿大学的实验室。继杰当时的英文阅读和写作能力很差。我对他的第一个就是,“每天花半小时读英文”。难能可贵的是:他下来了!经过几年的努力,2004年继杰已经能写出不错的grant proposal,2006年他的第一篇科研论文发表在《Molecular Cell》上,随后相继在《自然》发表两篇、在其它一流学术期刊发表十多篇论文。写作能力开始成熟。

  发表论文是一件值得高兴的事情,但要明白:论文只是一个载体,是为了向同行们宣告你的科研发现,是科学领域交流的重要工具。所以,在科研论文写作时,一定要谨记于心的就是:用最简单的话表达最明白的意思,但一定要逻辑严谨!其实,中文和英文论文皆如此!

  对CNS论文要见贤思齐》,恰好对CNS早就有些想法了,顺便记下来。首先,我总洋洋得意地认为CNS这个说法是我发明的(不排除英雄所见略同啊)。话说俺还是本科生的时候,98年上神经还是生理课老师讲CNS (Central Nervous System),知道了这么一个缩写。不久听本系一位老教授讲我们系里出了一个多牛的施一公,发表过Cell,Nature,Science (我本科的时候可能太不务正业了,根本不知道这些都是什么东西),随口嘟囔说这不就是CNS嘛。倒也从此留下了“发CNS=很牛”的印象(俺那时候是不具备的小本科生嘛,老教授说的话都挺当真理的)。慢慢自己做科研了,知道了学术期刊、学术论文,CNS念叨得就更多了,还给我们实验室的很多人科普了何谓CNS。再后来发现在网络上CNS也成了流行词,基于我当年经常混BBS,所以老琢磨着是不是我当年在哪个帖子里率先用了CNS的说法啊扯这一段是因为我觉得科学网的许多用户可能当年没泡过BBS,为了一些事情的争论啊、对于点击率的在乎啊等等,特别像我们年轻时在BBS上跟人吵架、关注自己的帖子是不是十大、是不是M一样,挺好玩的 -- 我总是这样,在进入正题之前,总要闲扯一段。唉,难怪我高考作文不及格。好,进入正题,关于发表CNS和期刊的影响因子。

  我对一种说法极其反感,即做科研就是为了发表论文。有没有搞错?中国自古就有“文以载道”的说法。如果没有文字的记录,我们怎能了解老祖那深邃的哲学思想,那灿烂的文学瑰宝?对于基础研究更是如此,不发表论文,别人、后人怎么知道你做的是什么东西?学术论文生动地体现了“文以载道”,是科学发现最主要的途径。比如,你可以说,我们中国人早就知道了。那好啊,给我文字记录。没有?对不起,只有发表过,所以他是《》的创始者。所以,科研不是为了发表论文,但发表论文是做科研的直接结果,可不要搞反了关系。

  我也特别反感那种狂妄地所谓烧多少钱砸出多少废纸。每当我看到不同专业的人互相,都不禁被者的无畏震撼。我有一个朋友的观点让我很赞同:他说他绝对不会对高铁问题发表意见。因为他自己经常受到诟病,可者基本都是外行,内容令人喷饭。所以尽管他是本领域的尖锐家,但绝不去做可笑的外行者。这个观点还让我汗颜了许久,因为7.23之后,我对高铁没少,并且我自己确实也不懂,只是一腔热血地在关注在评论,但是我承认他说的有理,所以之后我也尽量只提问,不评论了。哦,又跑题了,封博一个月的结果就是废话多。赶紧拉回来~~

  基础研究不同于应用研究,尽管有时候基础研究创造出来的价值远远超过人们甚至是研究者本人的想象,但是基础研究最直接的目的是为了“发掘创造新知识”(引用施一公的博文)。有了新知识,还要、交流,否则哪怕您发现了起源的奥秘呢,不说出来,自己带回大自然,对人类的智慧来说也毫无意义。要交流,可以通过人与人的交流,也可以通过媒介。人与人的交流,可以通过口口相传、学术报告等等,但是,只要没有有效的文字、声音、图像记录,就有扭曲、走样的,甚至还有关于某个重要发现原创人的争执,这种例子并不鲜见。比如对于青蒿素问题的争执,如果从一开始就严格按照国际惯例,有严格的作者署名规范,也不会引发出后来那么多争议。因此,知识的最终还是要通过媒介的记录。学术论文-文以载道!背后代表的是一个科学家的学术。严谨的论文体系是科学史的一部分,是人类知识体系的一部分。

  既然发表学术论文的目的是为了学术交流,理所当然希望发表的期刊有更大的影响力,这也就是为什么要发CNS,特别是NS(我对于不同专业的人都喊CNS也觉得挺好玩,Cell其实是一个挺专业的期刊,仅对微观生物学相关的适用啊。但简单起见,下文只用CNS,不再专门区分)。在各种学术期刊多如牛毛的今天,更想发CNS了,因为CNS可能是学术领域最具有影响力的学术期刊,有最广泛的来自各个学科的科研读者群,也就使得自己的论文更显眼(visible)、在学术界更有影响力。举一个我自己的例子:我们在2009年11月发表了一篇Nature Structural & MolecularBiology的论文,尽管内容上超过了同期发表的3篇Nature和Science论文,与另外一篇Nature基本相同,发表时间比其中两篇晚一点,比另外两篇却还早3天,但是从Google Scholar上查到的引用率来说,我们的论文仅被引用45次,而发表比我们晚三天,内容基本相同的Nature论文引用已达69次。这里面绝不是发表时间的区别,也不是论文本身质量的区别,仅仅是期刊的区别!我为此莫及,如果再给我一次机会的话,我一定要对Nature说三个字,那就是:我投你!如果要给审稿期加个期限,我希望是:一星期!

  因为文的目的是展示自己的学术,让更多的同行知道自己的研究进展,那么读者越多越广泛,越能达到这个目的。这也就不难理解为什么我们在投CNS论文时,如果遭到拒稿,不少的时候comment是“It may be submitted to a more specialized journal”,即如果你的研究结果不够新颖,不能让更多学科的人感兴趣的话,即使结果再solid,逻辑再完美,那也请投更专业的期刊吧,不适合CNS。从某种程度上讲,CNS是给外行看的。对于内行而言,不仅有本专业的学术期刊(specializedjournal),而且对某一特定内容,不论发表在哪里,总是可以通过各种数据库找出想要的论文。对于真正的内行,即使你发表在非常默默无名的,我也可以判断你的工作价值。可是,很不幸的是,在术业有专攻,学科分类越来越细,偏偏隔行又经常如隔山的今天,学术论文的影响因子不可避免地成了外行判断他人科研水平的简单标准。这种外行不仅是大领域,就算同在生物领域内部,我也不认为我可以准确评价神经生物学、发育生物学、系统生物学......的工作。理想的情况当然是任何时候都找到足够的内行来评价,但这似乎很难。特别是在各种评价、评、基金评审多得让人喘不过气来的现在,怎么可能任何时候都有足够的内行来评价你呢?在这种情况下,只能求助于已经经过了同行评议的论文,即其小同行已经帮我们这些不太懂的大同行或外行判断了这篇论文是否符合这个影响因子,尽管不可避免有偏差,但也算相对公平了。不是吗?就好像高考有局限性,但废除高考呢?最近北大通过面试自主招聘研究生的不就引发了很多人关于教育公平的更多忧虑吗?在缺乏足够的判断力的情况下,影响因子是退而求其次的不得已。但是对于一个学院的招聘、对于一个人的tenure evaluation这种至关重要的决定,一味讲究影响因子可能真的会误事,还是不管多麻烦,都请真正的内行来评价吧。

  最后,CNS对于一个领域的新人可能更重要一些,因为没有多少人了解你嘛。要是某个学术领域的大牛,就算他只是把工作发表在blog上,别人也是会关注到他(也许以后blog真能成为正式的发表途径呢,听说数学界就有类似的发表方式了,是么?)我就听说过某个领域的鼻祖级人物只投某个特定期刊,有年轻人问他:这么漂亮的工作,为什么不投Nature啊?他回答:这是“我”的工作,想知道的总能找到。可不是吗?对于我等小葱花,发表CNS是块敲门砖,是让国际同行迅速知道你的工作、意识到你存在的一条捷径;而一旦在一个领域成了大葱了,CNS神马的也就是浮云了。

  我盼着自己能达到绝对不在乎论文是否发表在CNS的那一天。其实,这也是某一个阶段的无奈,尽管想洒脱,但身为社会人,不可避免地一直被评价着,又不能真正地完全不在乎任何评价,于是也就给自己加了道。再扯就跑到月球了,打住~~

  P.S:我一直为自己的辞不达意头疼。比如我本来就我们的校庆发表了一篇的博文,却偏偏被朋友是在夸赞本文希望不要被理解为是在鼓吹就要发表CNS。我只想分析一下为什么重视CNS有其合,也有其局限性。

  大学教授,博导。2000年大学生物科学与技术系学士,2004年美国普林斯顿大学生物学系博士,2005—2007年在普林斯顿大学生物学系从事博士后研究。主要从事膜蛋白和植物脱落酸受体的结构和生物学机理的研究,已或合作在《自然》、《科学》、《细胞》等三大顶尖学术刊物上发表论文5篇。

  推荐:

  

相关阅读
  • 没有资料