其實我在 William’s Blog 雜談:arXiv 與特立獨行人士 談過。
其實這樣比較不是很適當。arXiv 基本上主要還是電子預印本 Pre-print。我想即使是在物理領域 arXiv 依然無法取代學術資料庫的地位。而且,像 arXiv,作者是可以把自己的文章撤下來的,再加上又沒有 peer-review,基本上他的定位就是『預印本』,而不是電子出版。
William 對 arXiv 的批評我也不甚認同。雖然 arXiv 在 CS 領域還很初淺,但不能這樣直接地去談它的『表現』。IEEE、ACM 本身是資電領域最大的學術社群,他們經營的學術資料庫和 arXiv 的立意並不相同;Goolar Scholar、CiteSeer、CiteULike 不但是後起之秀,基本上更偏向文獻資料庫,更注重書目資料和 Citation 分析,而不是文獻本身的散佈。
實際上,幾家大型出版機構,ACM, IEEE, SIAM, AMS 的 Database 又有幾家提供了同僚評註的功能? Seminal paper 自然會被不斷的 cite,譬如 S. Kirkpatrick, C. D. Gelatt, Jr., M.P. Vecchi 在 Science 上發表的 Optimization by simulated annealing,至少被 cite 五六千次。哪裡有比這個更好的同僚評註。
之前 arXiv 之所以增加 traceback 的功能,主要的原因(如果我沒記錯)除了在 Blog 等興起導致的互動性需求外,還是為了彌補缺乏 peer-review 的缺憾。
一個比較類似的網站是 ECCC - The Electronic Colloquium on Computational Complexity (應該算是另一種 e-Print)。有不少都是先發表在這裡然後才投到期刊,像是 The PCP Theorem by gap amplification, Proc. of 38th STOC, pp. 241-250, 2006. 原先就放在 ECCC 2005 上.
那麼,計算機科學領域有沒有可以和 arXiv 比擬的機構?
可以說有,也可以說沒有。計算機科學有自己特有的文化,Technical Reports!
表面上來看,技術報告可能是因為研究成果沒有好到讓期刊接受。但實際上也可以看成是某種預印本。技術報告是用來報導描述技術進步或科學或技術成果的研究開發。他們通常針對具體要求製作或研究需要,沒有 peer-review。
技術報告通常分為兩類:政府贊助的研究報告,私人資助的研究報告。(包括大學部、研究所、私營工業或政府機構和實驗室.)
實際上,在 CS 領域,常常是學術組織,或者大學本身會設置自己的 Technical Reports 資料庫。不過比起 arXiv,卻太過分散而未必能達到很好的交流效果,畢竟一個一個去查的時間成本太高了。
Ref.: SULAIR: How Do I Find?: Technical Reports
- On-line CS Techreports
- Networked Computer Science Technical Reference Library
- Defense Technical Information Center (DTIC)'s Scientific and Technical Information Network (STINET)
- Socrates
- The Virtual Technical Reports Center
- Princeton Computer Science :: Technical Reports
在 Some Advice on Writing a Technical Report 中 Alan T. Sherman 提到
The Technical Report (TR) is a common written form through which computer scientist communicate their findings. Each TR should have a focused topic that is developed logically along some clearly identified perspective.
A TR should explain what you did, why you did it, what you discovered, and what is significant of your findings. The report should identify clearly what is novel about your work, and how it relates to prior knowledge.
實際上,有不少理論計算機學者藉著 TR 來一方面做學術交流,一方面確保自己的優先權。不過這樣的風氣似乎日漸消退。Prof. Lance Fortnow 也曾經撰文討論這件事,也提到了結合 CiteSeer 或者 CiteULike 發展新一代 Technical Report 的可能性。

5 comments:
Blogger 是不是不會自動發 trackback 呀?我差一點就找不到這篇文章。
拿 arXiv 和其他老前輩相比較,或許立足點有點不公平,但以使用者角度來看,使用者只會在意合不合用,不太會管它的歷史及後台。
「IEEE、ACM 本身是資電領域最大的學術社群,他們經營的學術資料庫和 arXiv 的立意並不相同」,我同意;但對我來說,前者提供的「規模及細膩度」(我文中提過)是我非常在意的,尤其是在做文獻回顧及檢索時。這一點沒做好,就會大大降低對我的吸引力。
我一直很希望 arXiv 除了做為預印本典藏、同僚評註的功能角色之外,能在「規模及細膩度」方面多向其他學術網站取經。
对cs学科来说,arxiv也许确实不算太好。但是对物理学来说,arxiv是实实在在的促进了物理学的交流与发展。
关于citing的问题,有许多基于arxiv的网站承担了这个功能,比如这个网站:http://www.citebase.org
关于peer-review,我觉得这并不影响arxiv。许多arxiv上的论文实际上都不是preprint,而是post-print。发表之后再放到arxiv上去。而那些投稿同时就贴到arxiv上的论文,等论文接收发表后,作者也会标注清楚这篇论文已经在某某期刊某一期某一页发表了。
目前arxiv之类的预印本网站正式有peer-review的期刊。但是我觉得未来有这个可能。
To william:
『Blogger 是不是不會自動發 trackback 呀?』
應該是吧。我也不知道。
『使用者只會在意合不合用,不太會管它的歷史及後台。』
同意。不過老實說,錢是個問題。你所提的都要收費。Google 和 M$ 的姑且不提,因為他們的立意另有所圖。DBLP 和 Citseer 則常常掛掉。
基本上它還是靠 Cornell University 和 NSF 資助。在沒有收入的情況下,我覺得站穩腳步比較好。因此拿他和其他服務做全方面比較功能,我是覺得有一點不是太合適。
To yinzhangqi:
雖然我不是物理學界的人,但是就我所知,arxiv 已經有相當的接受度。我覺得很好。
這其實可能也有點領域不同的問題。純科學界和應用科學(工程)界對出版物(或者說專利問題)的態度可能有所不同。有一些出版商是不準放 post-print 的。(甚至在個人網頁上)
不過只要在物理界運作得好就好,這才是最實際的...:)
就我所知,arXiv 原本就是為了『最前源』的物理研究交流而架設的。在這個面向上,有沒有 peer-review 不是大問題。
我並沒有否定 arXiv,只是在這裡我是想談一下不同學門對預印本的作法。所以比較注重這個部份。
Post a Comment