這些大數(shù)據(jù)公司究竟是怎么樣來把客戶劃分等級(jí)呢?這自然是各家公司最頂級(jí)的商業(yè)秘密,當(dāng)然也是法律和道德沒有辦法約束的。就舉個(gè)非常簡單的例子,你以為商家給你發(fā)優(yōu)惠券僅僅是為了鼓勵(lì)你來購物、多購物嗎?優(yōu)惠券就是一個(gè)劃分等級(jí)的最好方式之一。滴滴公司的朋友就曾經(jīng)透露,他們通過優(yōu)惠券的使用就可以很清楚地掌握這個(gè)客戶所在的社會(huì)等級(jí)、家庭財(cái)富等等。
滴滴公司在幾年前發(fā)展最迅猛、優(yōu)惠打折最多的時(shí)候,每天會(huì)發(fā)出大量的優(yōu)惠券,數(shù)據(jù)工程師通過分析這些優(yōu)惠券的使用情況,就可以把客戶劃分為高中低三個(gè)檔次。高檔次,就是平時(shí)經(jīng)常用滴滴叫車,就算是發(fā)了優(yōu)惠券也不用,這就是有錢任性的高收入階層;中檔次,就是平時(shí)也用滴滴叫車,但是有了優(yōu)惠券叫車頻率會(huì)大大提高;低檔次,就是平時(shí)壓根不用滴滴,但是只要有優(yōu)惠券就用的“屌絲客戶”。當(dāng)然,還有一類最被“鄙視”的:平時(shí)不用滴滴,給了優(yōu)惠券到過期了也不用的。通過這個(gè)簡單粗暴的辦法,滴滴輕而易舉地篩選出了對(duì)自己最為有利的客戶,并且排除了那些毫無價(jià)值的客戶。
今天,每個(gè)行業(yè)每家公司都在做這件事情,建立最適合自己公司的“鄙視鏈”。就比如LinkedIn,它向男性用戶推薦的工作平均薪水概率上就是高于女性用戶。這也不能全怪?jǐn)?shù)據(jù)工程師,因?yàn)槲覀兩鐣?huì)上原本就存在著這樣那樣的偏見和歧視,它肯定會(huì)反應(yīng)在數(shù)據(jù)和算法中。數(shù)據(jù)工程師們也不是社會(huì)學(xué)專家,他們也不會(huì)考慮因?yàn)槠姾推缫曀鶐淼牡牡赖聜惱韱栴}。
“請(qǐng)你來警察局一趟,因?yàn)榇髷?shù)據(jù)說你有潛在犯罪的可能”
因?yàn)長inkedIn存在性別歧視,使很多人在職場(chǎng)得不到公正的待遇,這件事情讓人覺得不公平,那么大數(shù)據(jù)帶來的法律、道德和倫理問題,就更讓人覺得難以接受,必須要全社會(huì)立刻重視起來。
“請(qǐng)你來警察局一趟,因?yàn)榇髷?shù)據(jù)說你有潛在犯罪的可能”,這可不是美國大片里的臺(tái)詞。如果你生活在芝加哥,你有可能會(huì)因?yàn)榇髷?shù)據(jù)的算法而被請(qǐng)到警察局去喝茶,還有可能會(huì)成為被重點(diǎn)“關(guān)注”的對(duì)象。
2017年的早些時(shí)候,美國芝加哥市的市長宣布了一個(gè)新辦法來提高城市打擊犯罪的能力和精準(zhǔn)度。按照我們正常的思路,那就是擴(kuò)大警察隊(duì)伍、加強(qiáng)警察到社群巡邏等等。但是芝加哥的辦法卻不同,可也代表未來的趨勢(shì)——他們引入了一個(gè)軟件程序,用來預(yù)測(cè)居民潛在的犯罪可能性。
芝加哥警察準(zhǔn)備用這個(gè)數(shù)據(jù)分析軟件來確認(rèn)城市里的哪些人有較高的犯罪可能性,以便對(duì)這些人加強(qiáng)監(jiān)控,甚至?xí)r(shí)不時(shí)地拜訪這些人,以便更好提示他們不要犯罪,試圖通過這個(gè)辦法把犯罪扼殺在搖籃里。
但是顯而易見,這套大數(shù)據(jù)算法不可能消除人類社會(huì)已經(jīng)有的各種偏見和歧視。比如根據(jù)這套算法系統(tǒng),黑人等有色人種的潛在犯罪率遠(yuǎn)遠(yuǎn)高于白人男性,甚至一個(gè)沒有犯罪記錄的黑人小女孩的潛在犯罪率都比一個(gè)有犯罪前科的白人男性要高;低收入者就比高收入者的潛在犯罪率要高。
如果按這個(gè)劃分,在小縣城生活的人,潛在犯罪率就比在一線城市生活的人要高,要被警察重點(diǎn)關(guān)注,這顯然是不合理的。憑什么河北人民的潛在犯罪率就比北京人民高呢?
腦洞再大一點(diǎn),“潛在犯罪率”高的人,是不是從此就很難進(jìn)入政府部門工作、也很難獲得職場(chǎng)的升遷?某些人的一生是不是就會(huì)因此被改變?
如何破解“數(shù)據(jù)歧視”?
提升算法的透明度是最重要的解決方法。
不論是政府部門還是商業(yè)機(jī)構(gòu),任何一點(diǎn)帶有歧視和偏見的算法就會(huì)對(duì)不同的人群造成很大的影響,甚至?xí)`傷很多人。解決的辦法只有一個(gè):提升算法的透明度,這樣才能盡可能地保證數(shù)據(jù)采集的中立和算法的客觀。
理想的狀況是,任何使用大數(shù)據(jù)、算法的機(jī)構(gòu),包括政府和商業(yè)部門,每年都要像披露財(cái)務(wù)狀況一樣,披露數(shù)據(jù)采集的標(biāo)準(zhǔn)、核心算法的運(yùn)算原理等等,以供相關(guān)部門和第三方機(jī)構(gòu)核驗(yàn),看是否對(duì)特定人群造成了傷害和影響。