回答:這個(gè)太范化了吧。大數(shù)據(jù)架構(gòu)選擇的方案就有很多,海量數(shù)據(jù)的即席查詢本省就是業(yè)內(nèi)目前的痛點(diǎn),暫時(shí)沒有太好的解決方案,kylin等框架也只是一個(gè)折中方案,如果你不是要求海量數(shù)據(jù)分析的秒級(jí)響應(yīng)的話sparkSql、presto等都是不錯(cuò)的方案,分鐘級(jí)別可以返回。
回答:謝謝邀請(qǐng)!數(shù)據(jù)分析師通常分成兩種,一種是應(yīng)用級(jí)數(shù)據(jù)分析師,另一種是研發(fā)級(jí)數(shù)據(jù)分析師,區(qū)別就在于是否具備算法設(shè)計(jì)及實(shí)現(xiàn)的能力。應(yīng)用級(jí)數(shù)據(jù)分析師通常需要掌握各種數(shù)據(jù)分析工具,把業(yè)務(wù)模型映射到數(shù)據(jù)分析工具上,從而得到數(shù)據(jù)分析的結(jié)果。數(shù)據(jù)分析工具比較多,比如Excel就是一個(gè)傳統(tǒng)的數(shù)據(jù)分析工具,另外還有Minitab、LINGO、JMP等,要想全面掌握這些工具的使用需要具備一定的數(shù)學(xué)基礎(chǔ)和統(tǒng)計(jì)學(xué)基礎(chǔ)。通常...
回答:作為一個(gè)數(shù)據(jù)分析師來回答一下:我做這行兩年多了,剛開始的時(shí)候用的多是MySQL數(shù)據(jù)庫(kù),當(dāng)然,Oracle數(shù)據(jù)庫(kù)也會(huì)用到,尤其是在金融行業(yè)或者國(guó)企都用Oracle,一般的公司使用MySQL數(shù)據(jù)庫(kù),可能是因?yàn)镸ySQL數(shù)據(jù)庫(kù)免費(fèi)吧。另外,在一家互聯(lián)網(wǎng)公司,我遇到了mongodb,目前一些新興的互聯(lián)網(wǎng)公司使用nosql的也比較多,這個(gè)當(dāng)時(shí)是現(xiàn)學(xué)現(xiàn)賣的。作為一個(gè)數(shù)據(jù)分析師,可能對(duì)數(shù)據(jù)庫(kù)的使用一般是存取數(shù)據(jù)...
回答:優(yōu)秀的數(shù)據(jù)分析師并不能速成,但是零經(jīng)驗(yàn)也有零經(jīng)驗(yàn)的捷徑。市面上有《七周七數(shù)據(jù)庫(kù)》,《七周七編程語言》。今天我們就《七周七學(xué)習(xí)成為數(shù)據(jù)分析師》,沒錯(cuò),七周。第一周:Excel學(xué)習(xí)掌握如果Excel玩的順溜,可以略過這一周。但很多人并不會(huì)vlookup,所以有必要講下。了解sum,count,sumif,countif,find,if,left/right,時(shí)間轉(zhuǎn)換等。excel的各類函數(shù)很多,完全不...
回答:一名合格的數(shù)據(jù)分析師應(yīng)該掌握網(wǎng)頁(yè)爬蟲:Python或R數(shù)據(jù)存儲(chǔ):Excel或者Tableau、MangoDB等數(shù)據(jù)清洗:數(shù)據(jù)缺失處理等數(shù)據(jù)分析:線性回歸等數(shù)據(jù)可視化:Python或R的可視化包進(jìn)階級(jí)數(shù)據(jù)分析師:統(tǒng)計(jì)知識(shí)運(yùn)籌學(xué)知識(shí)機(jī)器學(xué)習(xí)知識(shí)掌握以上三個(gè)技能點(diǎn)便可稱之為數(shù)據(jù)科學(xué)家至于面試要準(zhǔn)備些啥?Simply按照上面技能點(diǎn)一一準(zhǔn)備但是今天要說的是一項(xiàng)奇淫技巧那就是--寫一篇數(shù)據(jù)分析的推文在這篇推文...
回答:大數(shù)據(jù)的技術(shù)大數(shù)據(jù)技術(shù)包括:1)數(shù)據(jù)采集: ETL工具負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。2)數(shù)據(jù)存?。?關(guān)系數(shù)據(jù)庫(kù)、NOSQL、SQL等。3)基礎(chǔ)架構(gòu): 云存儲(chǔ)、分布式文件存儲(chǔ)等。4)數(shù)據(jù)處理: 自然語言處理(NLP,Natural Language Processin...
...t分布)非對(duì)稱型(卡方分布、F分布) 二、項(xiàng)目實(shí)戰(zhàn)1 數(shù)據(jù)預(yù)處理2 樣本容量檢驗(yàn)3 假設(shè)檢驗(yàn)3.1 提出零假設(shè)和備擇假設(shè)3.2 確定檢驗(yàn)方向3.3 選定統(tǒng)計(jì)方法3.3.1 方法一:公式計(jì)算3.3.2 方法二:Python函數(shù)計(jì)算3.3.3 方法三:蒙特卡洛法...
... 大數(shù)據(jù)概述 1.1 大數(shù)據(jù)時(shí)代00 簡(jiǎn)要介紹01 時(shí)代背景的支撐 1.2 大數(shù)據(jù)的概念和影響00 大數(shù)據(jù)的 `4V ` 特性?01 大數(shù)據(jù)的影響 1.3 大數(shù)據(jù)的應(yīng)用00 影視劇的投拍01 谷歌預(yù)測(cè)流感03 ...
作者:xiaoyu 微信公眾號(hào):Python數(shù)據(jù)科學(xué) 知乎:python數(shù)據(jù)分析師 圣人曾說過:數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法只是逼近這個(gè)上限而已。 再好的模型,如果沒有好的數(shù)據(jù)和特征質(zhì)量,那訓(xùn)練出來的效果也不...
...的技術(shù)要點(diǎn)大掃盲MySQL:意外宕機(jī)不難解決,但你真的懂?dāng)?shù)據(jù)恢復(fù)嗎MySQL:每秒57萬的寫入,帶你飛MySQL:三大知識(shí)點(diǎn),索引、鎖、事務(wù),原理分析MySQL:查詢速度慢與性能差的解決方案MySQL:事務(wù)ACID特性的實(shí)現(xiàn)原理MySQL:大佬是怎...
...的技術(shù)要點(diǎn)大掃盲MySQL:意外宕機(jī)不難解決,但你真的懂?dāng)?shù)據(jù)恢復(fù)嗎MySQL:每秒57萬的寫入,帶你飛MySQL:三大知識(shí)點(diǎn),索引、鎖、事務(wù),原理分析MySQL:查詢速度慢與性能差的解決方案MySQL:事務(wù)ACID特性的實(shí)現(xiàn)原理MySQL:大佬是怎...
...: 入選Gartner和Forrester報(bào)告的AnalyticDB作為阿里巴巴的整套數(shù)據(jù)分析平臺(tái)的核心產(chǎn)品之一,承載了將數(shù)據(jù)探索實(shí)時(shí)化,在線化的關(guān)鍵任務(wù)。 前言 2018年3月13日,F(xiàn)orrester發(fā)布了最新的云化數(shù)據(jù)倉(cāng)庫(kù)分析報(bào)告( Now Tech: Cloud Data Warehouse, ...
...義,但圍繞業(yè)務(wù)能力,自動(dòng)化部署,網(wǎng)點(diǎn)智能以及語言和數(shù)據(jù)的分散控制等方面存在著某些共同特征。簡(jiǎn)而言之,微服務(wù)架構(gòu)是一種將單應(yīng)用程序作為一套小型服務(wù)開發(fā)的方法,每種應(yīng)用程序都在其自己的進(jìn)程中運(yùn)行,并與輕量...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺(tái)階。哪里可以獲得...
營(yíng)銷賬號(hào)總被封?TK直播頻繁掉線?雙ISP靜態(tài)住宅IP+輕量云主機(jī)打包套餐來襲,確保開出來的云主機(jī)不...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說合適,...