学会Python后,延期答辩距我真的远!
还有几个月就要毕业了,手里却连一篇 SCI 都没有,不仅自己心慌,连导师都开始捉急了:
“再写不出来就等着延毕吧!”
不出意外的话,导师的一世英名即将毁在我这个学渣手里。
但为了写论文,我也没闲着啊,甚至差点把命都搭上了。查文献到头秃、实验做到头秃、数据分析到头秃,过年愣是泡在实验室没回家,好不容易出了一稿,被打回来不说,修改意见还多得四五屏都看不完:
文章内容没有文献支撑,数据处理太粗糙,做出的图表不直观……
总之,就是不给发!
眼睁睁地看着同门师兄四个月发了 3 篇 SCI,我隐隐觉得自己好像错过了什么。
问了他之后才知道,发 SCI 不能靠死磕,更重要的是要找对方法——Python!
SCI投稿被拒,90%是这4点没做好
从选题到前期准备,甚至到后期论文格式的调整,Python 都能帮上大忙,真的是除了不能生孩子,啥都能做了!
文本挖掘
从 2019 年开始,对发表论文的要求越来越严格。博士论文抽检率约为 10%,硕士约为 5%。研究生学位论文的盲审专家从三个变成了五个,但凡有一个给出“不通过”的意见,论文就要被打回重写。
这就要求我们的选题要足够新颖,太老套的研究很容易被否定。
师兄建议我们试试写文本挖掘,他发的 3 篇 SCI 中就有两篇是关于文本挖掘的。文本挖掘是我们在许多专业的研究中都特别有效的一种分析方法。
用 Python 工具做中文分词,然后抽取有效、新颖、有用、可理解的、散布在文本中有价值的信息。
拿这种方法来做论文,瞬间就能实现有数据、有内涵、有深度,而且很受编辑和导师的青睐。
快速搜集文献
“不了解前人研究,文章没有理论支撑”,一旦你的论文被打上这个标签,那就意味着相关参考文献不达标:要么是数量少,要么是代表性不够。
师兄每次动笔前都先在知网上用 Python 网络爬虫查论文。内容覆盖新闻传媒、图书情报、经济管理、金融财政、投资证券、教育学、社会学、医学等多个学科,选题丰富,并且数据充足。
之前需要花一两个月才能找完的文献,Python 只需1分钟甚至几秒钟就能搞定。
此外,如果下载的文献是 PDF 的,用 Python 写个代码,还能一键批量转格式。
数据处理与可视化
科研人员跟数据打交道简直不要太频繁,理工科就不用说了,人文社科类文章的观点也需要大量的数据佐证。
而 Python 中的 pandas、numpy、statsmodels 等程序包都可以用来进行数据分析,这些第三方库可以在 Python 中可以直接调用,用起来非常方便。
同时,在当前 “ 数据量大且丰富 ” 的背景下,Python 还能自动生成美观且清楚的图表。像 PPI 图、热图、富集图、韦恩图、和弦图、火山图都是可以快速生成的。
参考文献排序
论文的质量不仅取决于内容,还取决于格式,谁还没几次熬夜改格式的经历呢?字体、字号、目录、脚注、参考文献……一个不对,就得打回来继续改。
拿参考文献排序来说,一般情况下,指导规范要求参考文献必须以第一作者的首字母排序。
图片
那么怎么才能把几十多条参考文献按照首字母排序呢?一条条拿眼睛对?
说实话我以前还真这么干的,也就花了一夜,改了十几次吧,最后还是被找出了毛病,甩回来重新改……
现在好了,用 Python 写几行代码就能把参考文献自动排序,既节省时间,还不会出错。
中科院早已普及的Python,你还不会用?
实际上,Python 在科研圈的应用并不新鲜,中科院早已开始在科研领域普及Python了:
工欲善其事,必先利其器。大数据时代,科研人想要如鱼得水,学会Python应当提上日程。