記者今天為此採訪了位於南加州的 Quality Software Developer (QSD)軟體開發公司。該公司在全球退黨服務中心、大紀元退黨網站的授權下,成功地獨家開發了退黨網絡在線實時分析系統最新版本, Quitting CCP Internet Data Real Time Analyzer, Ver1.0, 並於日前首度投入運行,對三退網絡數據進行了授權下的獨立檢索分析,於昨日正式發出檢索統計分析報告。
該報告表明:通過該網絡分析系統對於 2004年12月4至2006年6月4日期間550天的所有三退聲明數據進行電腦人工智能檢索分析,其結果顯示:在總數為10,894,981(6月4日下午6時51分美西時間)的三退人數中,有6,589,648人為中共黨員的退黨人數,占總三退人數的60.5%。由於尚有1078693人次的聲明因為中文表達的複雜特點令電腦分析系統不能確切判定,考量此100萬未確定的三退人群中尚含有一定數量的黨員退黨數字,故60.5%的退黨百分比為最低保守數字,而實際的退黨人數可能超出660萬這個保守退黨人數,大概至少有700萬中共黨員在過去的一年半中退出了中共組織。
記者採訪該公司軟體開發負責人劉博士,他介紹了他們首度運行該分析系統的情況和目前得知的最新數據。記者親自看到初次投入運行的快速網絡分析系統的實際運行情況,並對屏幕上的在線報告數據感到極大的興趣。劉博士在記者建議下獲得該網絡分析系統在本報告截止時間的屏幕快照畫面,上面的報告數據成為過去一年半期間中國大陸實際黨員退黨人數的首次數字證據之一。
「對於三退聲明的文字分析這一特定目的的軟體,我們首先採取人工的方法閱讀大量的三退聲明的文字數據,對於人們各種可能的表達方式、語法結構、用詞特點、標點使用、以及人們的語言心理過程等進行分析和分類。然後針對這些盡可能的語言模式設計出電腦分析用的各種過濾器。當文字信息經過這些過濾器時,它們將被自動篩選分類。過濾器即是一些關鍵詞的前後不同組合。比如:」
「退黨、退出共產黨、退出邪惡共產黨、退出邪黨、退出惡黨、退出中共、退出早年加入的共產黨、我曾加入過共產黨,現在退出、我是中共黨員,現在聲明退出,等等等等,許許多多的可能說法,更加對相關詞的先後搭配來分析其說話人的意思。以上這些說法都可分為退黨類中。」
「也有許多聲明有退黨、團、隊在同一個短句或段落中出現。這時必須對整個聲明進行讀寫和分析,從而做出正確判斷。凡是聲明人同時聲明退黨、退團、退隊的,就分為退黨類;凡是聲明人同時聲明退團、退隊的,就分為退團類;當然只是聲明退隊的那麼就是退隊類。句子中退黨、團、隊的順序可能各有不同,但根據其所退最高組織為準而分類。」
「對於同一聲明中多人聲明退黨團隊的,需要逐字分析哪些人屬於退黨,哪些人是退團或者退隊的。有時聲明人寫的清楚,如退黨人:XXX,XXX,XXX,列出人名。那麼我們的軟體可以清點人數而將其歸入退黨類。人名可能以逗號分開,也可能以頓號、甚至個別的也有用其他標點分開的。有時是中文的標點,也有時是英文的標點,這都要加以區分方可準確無誤地數清人數。在人名前的引導詞,也可能是各種說法,比如:「退黨聲明人:」「退黨團隊人:」「退黨、團、隊人:」「退黨,團,隊人:」「退黨退團退隊人:」等等,許多可能都要考量進去。這裏就不去一一列舉了。總之,我們的軟件工程師竭力將各種中文的語言表達方式「教」給電腦,讓它掌握識別分析此類中文語句的能力。」
「過去整整550天的退黨大潮中,我們的網絡系統對每一天每一個記錄進行逐字分析,我們的面前掠過一個個以日期、時間分秒、人名、地區、聲明人數、聲明全文為記錄項目的真實文字數據,有的是一個人退黨,有的是成群結隊數百人集體退黨,就是受到這些人們的精神力量的鼓舞,我們一次次不倦地修改和完善著我們的軟體,最終得以順利完成。」
「我們對我們的產品及其分析結果的準確度具有足夠的信心,我們曾經對現有分析結果,通過部分人工閱讀分類的方法加以評估,結果與我們的電腦軟體分析結果相吻合。希望我們的分析數據對於各界人士提供有價值的參考。我們還將繼續努力,對於那些尚未確定分類的占總三退人數9.9%的100萬三退聲明進行更高一級的分析檢索。我們在升級我們的版本,設計一種更為合理準確的檢索系統,降低誤差和不確定分類的比例。」
「在共產黨的紅色宣傳和蒙騙中,我帶著個人目的入了黨。自從入黨後,我深感痛悔,因為我越來越認識到共產黨是一個說謊的黨,是一個整人的黨,是一個假話說盡壞事做絕的黨。近幾年來,我更感到它是一個禍國殃民的邪靈,它的實質--不僅狡詐、尖滑、墮落腐敗,而且發展為好壞不分,正邪不分,善惡不分,黑白顛倒。它兇惡、殘暴,流氓手段,比黑社會更邪。為此,我特聲明從今以後退出共產黨,不再參加其組織的任何活動,以前的入黨宣誓我宣布作廢。」
(圖片來源 : 大紀元)