您當前的位置:首頁 > IT編程 > 學術與代碼
| C語言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 學術與代碼 |

各領域公開數據集下載-收藏

51自學網 2029-11-05 21:04:02
  學術與代碼

金融

美國勞工部統計局官方發布數據

房地產公司 Zillow 公開美國房地產歷史數據

滬深股票除權除息、配股增發全量數據,截止 2016.12.31

上證主板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,1260支股票

深證主板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,466支股票

深證中小板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,852支股票

深證創業板日線數據,截止 2017.05.05,原始價、前復權價、后復權價,636支股票

上證A股日線數據,1999.12.09至 2016.06.08,前復權,1095支股票

深證A股日線數據,1999.12.09至 2016.06.08,前復權,1766支股票

深證創業板日線數據,1999.12.09 至2016.06.08,前復權,510支股票

MT4平臺外匯交易歷史數據

Forex平臺外匯交易歷史數據

幾組外匯交易逐筆(Ticks)數據

美國股票新聞數據【Kaggle數據】

美國醫療保險市場數據【Kaggle數據】

美國金融客戶投訴數據【Kaggle數據】

Lending Club 網貸違約數據【Kaggle數據】

信用卡欺詐數據【Kaggle數據】

美國股票數據XBRL【Kaggle數據】

紐約股票交易所數據【Kaggle數據】

貸款違約預測競賽數據【Kaggle競賽】

Zillow 網站房地產價值預測競賽數據【Kaggle競賽】

Sberbank 俄羅斯房地產價值預測競賽數據【Kaggle競賽】

Homesite 保險定價競賽數據【Kaggle競賽】

Winton 股票回報率預測競賽數據【Kaggle競賽】

房屋租賃信息查詢次數預測競賽【Kaggle競賽】

  

交通

2013年紐約出租車行駛數據

2013年芝加哥出租車行駛數據

Udacity自動駕駛數據

紐約Uber 接客數據 【Kaggle數據

英國車禍數據(2005-2015)【Kaagle數據】

芝加哥汽車超速數據【Kaggle數據】

KITTI 自動駕駛任務數據【數據太大僅有部分】

Cityscapes 場景標注數據【數據太大僅有部分】

德國交通標志識別數據

交通信號識別數據

芝加哥Divvy共享自行車騎行數據(2013年至今)

美國查塔努加市共享單車騎行數據

Capital 共享單車騎行數據

Bay Area 共享單車騎行數據

Nice Ride 共享單車騎行數據

花旗銀行共享單車騎行數據

運用衛星數據跟蹤亞馬遜熱帶雨林中的人類軌跡競賽【Kaggle競賽】

紐約出租車管理委員會官方的乘車數據(2009年-2016年)

 

商業

Airbnb 開放的民宿信息和住客評論數據

Amazon 食品評論數據【Kaggle數據】

Amazon 無鎖手機評論數據【Kaggle數據】

美國視頻游戲銷售和評價數據【Kaggle數據】

Kaggle 各項競賽情況數據【Kaggle數據】

Bosch 生產流水線降低次品率競賽數據【Kaggle競賽】

預測公寓租金競賽數據

廣告點擊預測競賽數據

餐廳營業收入預測建模競賽

銀行產品推薦競賽數據

網站用戶推薦點擊預測競賽數據

在線廣告實時競價數據【Kaggle數據】

購物車商品關聯競賽數據【Kaggle競賽】

Airbnb 新用戶的民宿預定預測競賽數據【Kaggle競賽】

Yelp 點評網站公開數據

KKBOX 音樂用戶續訂預測競賽【Kaggle競賽】

Grupo Bimbo 面包店庫存和銷量預測競賽【Kaggle競賽】

 

推薦系統

Netflix 電影評價數據

MovieLens 20m 電影推薦數據集

WikiLens

Jester HetRec2011

Book Crossing Large MovieReview

Retailrocket 商品評論和推薦數據

1萬本暢銷書的6百萬讀者評分數據

 

醫療健康

人識別物體時大腦核磁共振影像數據

人理解單詞時大腦核磁共振影像數據

心臟病心房圖像及標注數據

細胞病理識別

FIRE 視網膜眼底病變圖像數據

食物營養成分數據 【Kaggle數據】

EGG 大腦電波形狀數據【Kaggle數據】

某人基因序列數據【Kaggle數據】

癌癥CT影像數據【Kaggle數據】

軟組織肉瘤CT圖像數據【Kaggle數據】

美國國家健康與服務部-國家癌癥研究所發起的癌癥數據倉庫介紹【僅有介紹】

Data ScienceBowl 2017 肺癌識別競賽數據【數據太大僅有介紹】

TCGA-LUAD 肺癌CT圖像數據

RIDER Lung CT 肺癌CT影像

TCGA-COAD癌癥CT影像數據

TCIA-TCGA-OV 癌癥CT影像數據

TCIA RIDER NEURO癌癥MRI影像數據

QIN Beast 乳腺癌MRI影像數據

SPIE-AAPM-NCIPROSTATEx競賽第1部分數據(MRI核磁共振影像識別前列腺癌程度數據)SPIE-AAPM-NCIPROSTATEx競賽第2部分數據(MRI核磁共振影像識別前列腺癌程度數據)RIDER Breast 乳腺癌 MRI 影像數據

Lung Phantom 癌癥 CT 影像數據集

TCIA-QIN-LUNG 肺癌 CT 影像數據集

醫療CT影像、年齡和對比標注數據【Kaggle競賽】

TCGA-ESCA癌癥 CT 影像數據集

TCGA-CESC癌癥 CT 影像數據集

TCGA-KICH癌癥 CT 影像數據集

從 CT 影像中對肺部影像進行分割并識別肺部容積【Kaggle競賽】

通過Egg腦電圖像預測患者癲癇病發作競賽【Kaggle競賽】

遺傳突變分類競賽【Kaggle競賽】

MIMIC-III 臨床監護數據

 

圖像數據

綜合圖像

Visual Genome 圖像數據

Visual7w 圖像數據

COCO 圖像數據

SUFR 圖像數據

ILSVRC 2014 訓練數據(ImageNet的一部分)

PASCAL Visual Object Classes 2012 圖像數據

PASCAL Visual Object Classes 2011 圖像數據

PASCAL Visual Object Classes 2010 圖像數據

80 Million Tiny Image 圖像數據【數據太大僅有介紹】

ImageNet【數據太大僅有介紹】

Google Open Images【數據太大僅有介紹】

Imagenet 小尺寸圖像數據集

Yahoo Flickr 照片和視頻數據集

 

場景圖像

Street Scences 圖像數據

Places2 場景圖像數據

UCF GoogleStreet View 圖像數據

SUN 場景圖像數據

The Celebrity inPlaces 圖像數據

 

Web標簽圖像

HARRISON 社交標簽圖像

NUS-WIDE 標簽圖像

Visual Synset 標簽圖像

Animals WithAttributes 標簽圖像

 

人形輪廓圖像

MPII Human Shape人體輪廓數據

Biwi Kinect Head Pose 頭部姿勢數據

上半身人像數據 INRIA Person 數據集

 

視覺文字識別圖像

Street View House Number 門牌號圖像數據

MNIST 手寫數字識別圖像數據

3D MNIST 數字識別圖像數據【Kaggle數據】

MediaTeam Document 文檔影印和內容數據

Text Recognition 文字圖像數據

NIST Handprinted Forms and Characters 手寫英文字符數據

NIST Structured Forms Reference Set of Binary Images (SFRS) 圖像數據

NIST Structured Forms Reference Set of Binary Images (SFRS) II 圖像數據

 

特定一類事物圖像

著名的貓圖像標注數據

Caltech-UCSDBirds200 鳥類圖像數據

Stanford Car 汽車圖像數據

Cars 汽車圖像數據

MIT Cars 汽車圖像數據

Stanford Cars 汽車圖像數據

Food-101 美食圖像數據

17_Category_Flower 圖像數據

102_Category_Flower 圖像數據

UCI Folio Leaf 圖像數據

Labeled Fishes in the Wild 魚類圖像

美國 Yelp 點評網站酒店照片

CMU-Oxford Sculpture 塑像雕像圖像

Oxford-IIIT Pet 寵物圖像數據

Nature Conservancy Fisheries Monitoring 過度捕撈監控圖像數據【Kaggle數據】

Stanford Dogs Dataset 數據集

辛普森一家卡通形象圖像【Kaggle競賽】

Fashion-MNIST 時尚服飾圖像數據

 

材質紋理圖像

CURET 紋理材質圖像數據

ETHZ Synthesizability 紋理圖像數據

KTH-TIPS 紋理材質圖像數據

Describable Textures 紋理圖像數據

 

物體分類圖像

COIL-20 圖像數據

COIL-100 圖像數據

Caltech-101 圖像數據

Caltech-256 圖像數據

CIFAR-10 圖像數據

CIFAR-100 圖像數據

STL-10 圖像數據

LabelMe_12_50k圖像數據

NORB v1.0 圖像數據

NEC Toy Animal 圖像數據

iCubWorld 圖像分類數據

Multi-class 圖像分類數據

GRAZ 圖像分類數據

 

人臉圖像

IMDB-WIKI 500k+ 人臉圖像、年齡性別數據

Labeled Faces in the Wild 人臉數據

Extended Yale Face Database B 人臉數據

Bao Face 人臉數據

DC-IGN 論文人臉數據

300 Face in Wild 圖像數據

BioID Face 人臉數據

CMU Frontal Face Images

FDDB_Face Detection Data Set and Benchmark

NIST Mugshot Identification Database Faces in the Wild 人臉數據

CelebA 名人人臉圖像數據

VGG Face 人臉圖像數據

Caltech 10k WebFaces 人臉圖像數據

  

姿勢動作圖像

HMDB_a large human motion database

Human Actionsand Scenes Dataset

Buffy Stickmen V3 人體輪廓識別圖像數據

Human Pose Evaluator 人體輪廓識別圖像數據

Buffy pose 人類姿勢圖像數據

VGG Human Pose Estimation 姿勢圖像標注數據

 

指紋識別

NIST FIGS 指紋識別數據

NIST Supplemental Fingerprint Card Data (SFCD) 指紋識別數據

NIST Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指紋識別數據

NIST Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指紋識別數據

 

其它圖像數據

Visual Question Answering V1.0 圖像數據

Visual Question Answering V2.0 圖像數據

 

視頻數據

綜合視頻

DAVIS_Densely Annotated Video Segmentation 數據

YouTube-8M 視頻數據集【數據太大僅有介紹】

YouTube 網站視頻備份【數據太大僅有介紹】

 

人類動作視頻

Microsoft Research Action 人類動作視頻數據

UCF50 Action Recognition 動作識別數據

UCF101 Action Recognition 動作識別數據

UT-Interaction 人類動作視頻數據

UCF iPhone 運動中傳感器數據

UCF YouTube 人類動作視頻數據

UCF Sport 人類動作視頻數據

UCF-ARG 人類動作視頻數據

HMDB 人類動作視頻

HOLLYWOOD2 人類行為動作視頻數據

Recognition of human actions 動作視頻數據

Motion Capture 動作捕捉視頻數據

SBU Kinect Interaction 肢體動作視頻數據

 

目標檢測視頻

UCSD Pedestrian 行人視頻數據

Caltech Pedestrian 行人視頻數據

ETH 行人視頻數據

INRIA 行人視頻數據

TudBrussels 行人視頻數據

Daimler 行人視頻數據

ALOV++ 物體追蹤視頻數據

 

密集人群視頻

Crowd Counting 高密度人群圖像

Crowd Segmentation 高密度人群視頻數據

Tracking in High Density Crowds 高密度人群視頻

 

其它視頻

Fire Detection 視頻數據

 

音頻數據

綜合音頻

Google Audioset 音頻數據【數據太大僅有介紹】

 

語音識別

Sinhala TTS 英語語音識別

TIMIT 美式英語語音識別數據

LibriSpeech ASR corpus 語音數據

Room Impulse Response and Noise 語音數據

ALFFA 非洲語音數據

THUYG-20 維吾爾語語音數據

AMI Corpus 語音識別

 

自然語言處理

RCV1英語新聞數據

20news 英語新聞數據

First Quora Release Question Pairs 問答數據

JRC Names各國語言專有實體名稱

Multi-Domain Sentiment V2.0

LETOR 信息檢索數據

Yale Youtube Vedio Text斯坦福問答數據【Kaggle數據】

美國假新聞數據【Kaggle數據】

NIPS會議文章信息數據(1987-2016)【Kaggle數據】

2016年美國總統選舉辯論數據【Kaggle數據】

WikiLinks 跨文檔指代語料

European Parliament Proceedings Parallel Corpus 機器翻譯數據

WikiText 英語語義詞庫數據

WMT 2011 News Crawl 機器翻譯數據

Stanford Sentiment Treebank 詞匯數據

英語語言模型單詞預測競賽數據

WikiAnswers 問題復述數據集

中文經典典籍語料

幾個網上采集的自然語言語料中文姓名語料

81萬互聯網詞匯詞庫

Question-Answer 問答數據集

Wikilinks 跨文檔語料擴展版

幾個聊天機器人語料

TED 平行語料庫

 

社會數據

希拉里郵件門泄露郵件

波士頓Airbnb 公開數據【Kaggle數據】

世界各國經濟發展數據【Kaagle數據】

世界大學排名芝加哥犯罪數據(2001-2017)【Kaagle數據】

世界范圍顯著地震數據(1965-2016)【Kaagle數據】

美國嬰兒姓名數據【Kaagle數據】

全世界鯊魚襲擊人類數據【Kaagle數據】

1908年以來空難數據【Kaagle數據】

2016年美國總統大選數據【Kaagle數據】

2013年美國社區統計數據【Kaagle數據】

2014年美國社區統計數據【Kaagle數據】

2015年美國社區統計數據【Kaagle數據】

歐洲足球運動員賽事表現數據【Kaagle數據】

美國環境污染數據【Kaagle數據】

美國H1-B簽證申請數Kaggle數據】

IMDB五千部電影數據【Kaggle數據】

2015年航班延誤和取消數據【Kaggle數據】

兇殺案報告數據【Kaggle數據】

人力資源分析數據【Kaggle數據】

美國費城犯罪數據【Kaggle數據】

安然公司郵件數據【Kaggle數據】

歷史棒球數據【Kaggle數據】

美聯航 Twitter 用戶評論數據【Kaggle數據】

波士頓 Airbnb 公開數據【Kaggle數據】

芝加哥市2001年以來犯罪記錄數據

美國查塔努加市犯罪記錄數據(2003年至今)

芝加哥街邊咖啡廳季節中的人行道咖啡廳許可數據

芝加哥餐館衛生檢查結果數據

幾個人類運動位置路線GPS數據集(騎行、跑步等)

希拉里 vs 特朗普競選期間 Twitter 數據【Kaggle競賽】

美國連環兇案數據(1980-2014)【Kaggle競賽】

廣告實時競價數據【Kaggle競賽】

美國費城犯罪記錄數據【Kaggle競賽】

Reddit 用戶交互記錄【Kaggle競賽】

泰坦尼克災難數據【Kaggle競賽】

Wikipedia 頁面點擊流量數據【Kaggle競賽】

紐約市出租車乘車時間預測競賽數據【Kaggle競賽】

新聞和網頁內容推薦及點擊競賽【Kaggle競賽】

科比布萊恩特投籃命中率數據【Kaggle競賽】

幾個城市氣象交換站日間天氣數據

Reddit 2.5 百萬社交新聞數據

Google的機群訪問數據

MIT Saliency 眼睛瀏覽軌跡數據集

根據安檢人體掃描成像預測威脅競賽【Kaggle競賽】

 

處理后的科研和競賽數據

NIPS 2003 屬性選擇競賽數據

臺灣大學林智仁教授處理為 LibSVM 格式的分類建模數據

Large-scale 分類建模數據

幾個UCI 中 large-scale 分類建模數據

Social Computing Data Repository 社交網絡數據

貓和狗分類識別競賽數據【Kaggle競賽】

DSTL 衛星圖像識別競賽數據【Kaggle競賽】

根據手機應用軟件使用行為預測用戶性別年齡競賽數據【Kaggle競賽】

人臉關鍵點標定競賽數據【Kaggle競賽】

Kaggle競賽數據合輯(部分競賽數據)

UCI多分類組合出的二分類數據集

UCI經典二分類數據集

場景圖像分類競賽數據【ChallengerAI 競賽】

人體骨骼關鍵點檢測競賽數據【ChallengerAI 競賽】

圖像中文表述競賽數據【ChallengerAI 競賽】

英文同聲傳譯競賽數據【ChallengerAI 競賽】

中英文本翻譯競賽數據【ChallengerAI 競賽】

虛擬股票趨勢預測【ChallengerAI 競賽數據】

機器視覺推理實驗數據

BigMM 2015 競賽驗證數據集

KONECT 網絡圖結構和網絡科學數據合輯

  

轉自:https://blog.csdn.net/linqianbi/article/details/78626130


標簽: dataset數據集
好文要頂 關注我 收藏該文
51自學網,即我要自學網,自學EXCEL、自學PS、自學CAD、自學C語言、自學css3實例,是一個通過網絡自主學習工作技能的自學平臺,網友喜歡的軟件自學網站。
京ICP備13026421號-1
炒股是怎么玩的