大学不应该讲授任何商业统计软件

前一阵子在统计之都看到了《matlab取消中国高校授权》的帖子,具体是围绕着哈工大发现学校购买的matlab授权被取消了。这其实是美国对华科技限制的体现。这只是个开端,今天matlab不能用,明天Mathematica,SAS,SPSS,Stata,EViews也危在旦夕。

我没有学过Matlab,只是有一次选课差点学了Mathematica,但当时看是个收费的软件都退了。商业统计类软件我只学过SPSS和Stata(现在几乎全忘了)。这两个软件的性能真是一言难尽,就不说了。我还是比较介意收费这一点的。记得学SPSS的时候需要下载学校数据库提供的正版授权软件,然后还必须连接校园网才能用。这个就把我劝退了,导致我现在不咋会用SPSS。

但收费也好,禁用授权也好对大部分学生和老师来说没有啥影响。毕竟他们用盗版软件。

学Stata的时候是老师直接提供盗版软件用。唉。其实盗版软件和正版没有任何区别。反正有盗版大家都用了,默认这一点是理所应当的。严格来说发表论文是不能用盗版软件的,但我很怀疑这是否能限制科研人员用盗版软件写论文。

其实封了正版授权不可怕,真正可怕的是像Matlab这种工具已经渗透到工业的方方面面了,或者说在某个学科中某个软件几乎成为了一家独大。这样的话你不用这个软件就没法加入游戏,因为整个系统的考核标准都基于它。你用其他再好的软件别人也没学过,你只能自命清高。

而促使这种情况发生的,正是盗版软件的盛行。使用商业软件的成本降为0。有的不用安装就能用。反而是Python,R这些开源编程语言安装起来要花点时间配置环境变量、安装IDE、安装扩展包等等。

我内心非常同意吴喜之老师的观点,即使用商业软件会导致国家安全问题。而且我自己也是开源软件的坚定支持者,理由如下:

  • 开源软件源代码完全公开,不用担心不懂程序内部原理的黑盒问题

  • 开源软件扩展性更好,可以自己编程序定制功能

  • 开源软件免费(虽然没啥用,用商业软件的有几个缴费了?)

用商业软件者的理由是:

  • 我没想辣么多,学校教啥我就用啥(这条无法反驳,归根结底是学校及教育系统的问题)

  • 商业软件好用(我承认,商业软件的API都是包装好的,输入几个变量就出来结果,但是你懂内部的原理吗?)

  • 商业软件免费(盗版)

我觉得商业软件的基本套路是:

  1. 制造好看实用的用户界面(这个倒没什么,RStudio、Jupyter都是这样的)

  2. 利用用户的“偷懒”心理,将复杂的计算封装成简单好用的api给用户,让用户轻松“驾驭”复杂分析方法,从而对它形成依赖。

  3. 将产品推销给高校、企业,促进形成盗版产业链,形成根本性的依赖(所以吴喜之老师说他们不怕你盗版,就怕你不上瘾)。

商业软件的流行其实就如同目前我们广泛使用的QWER键盘一样(详见这里)。这种键盘排列的打字效率是十分低下的(因为它将高频字母的距离移得很远),远不如正常排列的ABCD键盘。但是当初的打字机厂商为了推销打字机,配备了免费的培训服务。因此通过用户的惯性依赖,逐渐抢占了100%的市场份额。

而开源软件永远比较佛系,不可能会有如此精妙的市场营销策略。所以开源软件的推广永远是个麻烦。你几乎永远无法向商业软件说明开源软件的优势。扭转目前的使用局面也无异于让所有人将自己的QWER键盘替换为ABCD键盘。

不过我还是想对不满于商业软件的有志青年/数据分析者/学术研究者/教育部门相关决策者说一句:

大学不应该讲授任何商业统计软件