2020 DATATHON 數據松
如果您…
累積了數據分析技能,正在尋找一個磨練運用的場合
對資料充滿熱情,想認識高手、認識志同道合的夥伴
想認識用數據賺錢的公司,一窺私有資料
運用您的看家本領建立合作機會
首場私有資料+資料疊合 2020 DATATHON
找好隊友來報名吧
「2020 DATATHON數據松」由經濟部工業局主辦,財團法人資訊工業策進會執行,以鼓勵跨領域資料多元疊合的理念出發,提供企業內部真實數據資料,包括社群輿情資料、消費行為數據、氣象資料,誠摯邀請各路好手來一同玩數據!
本活動適合程式開發、資料科學、數據分析、設計相關專業背景之工程師、新創團隊或學生參加,想一睹商業資料的秘辛,玩出不一樣的市場分析結果,或者做為未來求職的跳板,你一定不能錯過2020 DATATHON 數據松
***主辦單位保留視情況調整、取消活動之權利
主辦單位:
執行單位:
合作推廣夥伴:
數據主題
Hacking with DATA!
[2020數據松] Data集合啦!資料創新大會
-
主題內容:本次數據松活動邀請企業提供今年1到6月份不同來源的資料,以時間、地點或其他維度為主軸進行堆疊,涵蓋了不同季節、議題與消費行為,期待能以異質的資料碰撞出新的火花,展現Data fusion帶來的價值與新洞見,或發展能改變生活或發展商業機會的新應用。
-
資料使用:必須使用2種以上之「企業提供data」+「其他data」(可使用不同企業之data、提前自備、自行蒐集,或使用open data)
-
作品:以互動型的資料呈現,或web/app應用呈現
活動資料內容說明
全台每小時天氣觀測資料集
資料集簡介
由天氣風險蒐集全台灣的氣象觀測數據,氣象觀測最早從1885年開始,迄今已有一百多年歷史,本次活動提供今年1~6月份經過資料校正的觀測資料,有21項欄位,將近260萬筆資料,包含中央氣象局、經濟部水利署及農委會水保局佈建的氣象測站,多達606個測站,觀測儀器大致分三種,由人工觀測的局屬觀測站,以及完全由儀器觀測的自動氣象站和自動雨量站。
天氣風險公司為台灣第一家民間氣象公司,成立於2003年,擁有政府核發的氣象與海象預報證照。推動台灣的氣象產業,致力於氣象加值服務,目前將氣象資料成功應用於防災、企業風險管理、氣象經濟、氣候評估、媒體傳播及環境教育等服務。主要服務客戶跨及媒體、運輸、製造、物流、通路等超過300家民間企業及各政府機關。
資料集簡介
發票來源:自『發票怪獸App』蒐集到的無記名發票資料
筆數:約 1000萬筆
隨機取樣方式:以系統會員uuid末一碼當做過濾條件,撈取對象的全部發票資料
定位 = Martech = 懂廣告的科技公司,有數據平台的廣告公司。
近三年獎項:動腦雜誌年度行銷傳播傑出貢獻獎、4A廣告獎、時報廣告金像獎、動腦雜誌廣告行銷10大金句獎、數位奇點獎最佳AI應用獎、最佳產品獎、最佳互動獎、廣告雜誌年度十大廣告案例、大中華區艾菲獎季節營銷獎入圍…
參加流程
資料集簡介
網路輿情發文來源資料集,為公開性網路輿情出現時的發佈來源、出現時間、URL。本資料集為JSON格式。
藍星球資訊股份有限公司創立於2013年,組成兼具「資訊」技術與「人文」精神的團隊,為國立臺灣大學官方正式技術轉移的科技公司,致力於數位化、詮釋資料分析、數位加值及資料庫檢索技術整合之服務與研發。
藍星球團隊專精中文資料處理,提供智慧化的文本分析、相似文件群集、前後文自動化串聯等文本探勘技術,有系統地處理非結構巨量資料內容,找出關鍵精華。服務領域包含語意分析技術導入、數位典藏系統、開放資料發佈平台、新聞與社群輿情口碑分析系統、企業開放資料整合平台等。
目前已推出「透事THOUGHTS雲端服務API」面向中文大數據分析市場;以及「蛛思CHOOSE輿情智慧分析平台」提供快速準確、多元分析、精緻圖表的口碑監測系統。近期將推出企業開放資料搜尋分析平台。
02/
參加DATATHON挑戰自我
-
入選團隊須於9月11日至9月13日出席,並於活動現場與資料提供業者簽訂「數據使用及保密同意書」,並繳交一組$500之押金(活動發表完後簽收返回),始可取得數據松活動使用之資料。
03/
作品發表
進度分享(一組5 分鐘):可用簡報呈現目前進度、遭遇的技術問題或技術分享,亦可demo專案開發進度,以利說明。
成果上傳:作品發表於9月13日13:00成果發表前將「成果簡報」(格式不拘,可包含作品名稱、團隊名稱、團隊成員,並說明如何使用數據與驗證結果)上傳至主辦單位指定空間
成果發表(一組5分鐘,5分鐘QA + 講評 ):以簡報說明使用的資料集和解決的主題,可擷取分析成果的截圖加以說明團隊使用的分析技術。並透過demo專案內容(App、Web、ChatBot等形式)展示疊合分析成果。
***主辦單位保留視情況調整、取消活動之權利
網路輿情發文來源資料集
電子發票消費資料集
活動時間
09/11 18:00
|
09/13 18:00
活動場地
資策會 教研所
台北市信義路三段
(待確認後通知參加團隊)
現場供應
現場備有無線網路、電源插座、延長線、紙筆,請自備其他作品開發所需工具如筆電等
精神
本活動鼓勵友善的交流開發風氣,歡迎團隊間互相討論成長,發揮共同合作,解決問題的精神
重要時程
活動流程
Day 1- 9/11 (五)
時間 活動內容
17:00 ~ 18:00 參加者報到
18:00 ~ 18:10 活動開場
18:10 ~ 18:20 數據松主題說明
18:20 ~ 18:40 資料使用說明與下載
18:40 ~ Hack Time
Day 2- 9/12 (六)
時間 活動內容
~ 12:00 Hack Time
12:00 ~ 13:00 午餐時間
13:30 ~ 15:00 進度分享
15:00 ~ 17:30 Hack Time
17:30 ~ 18:30 晚餐時間
18:30 ~ Hack Time
Day 3- 9/13 (日)
時間 活動內容
~ 12:00 Hack Time
12:00 ~ 13:00 午餐時間
13:30 ~ 16:30 成果發表
16:40 ~ 16:50 人氣投票
16:50 ~ 17:00 頒獎,合照
17:00 ~ 18:00 交流時間
評審
宋浩
藍星球資訊總經理、東吳大學巨量資料管理學院兼任助理教授,擔任國家發展委員會開放資料平台(data.gov.tw)及臺北市政府開放資料平台(data.taipei)計畫主持人,專精於文字探勘、語意分析、檢索理論、軟體工程與資料庫系統。擁有超過二十年以上網站、軟體、APP開發經驗。
曾參與行政院10朵政府雲之中兩朵雲的開發作業、以及數位典藏與數位學習國家型科技計畫等國家級專案執行。
謝孟格
現職於天氣風險公司,擔任資料分析師暨天氣分析師,同時也是氣象主播,熟悉各種氣象資料分析方法,用於防災及商品需求等應用經驗,擅長利用資料分析來解決客戶的天氣問題。
張麗卿
現職於春樹科技業務副總,負責發票怪獸數據應用業務,曾任職台灣最大的會員卡平台HAPPY GO負責數據行銷業務主管,數據行銷是運用海量數據了解消費者行為,從了解消費者到引導購買進而改變消費習慣,數據分析的結果可以協助行銷重要歷程的決策,數據真相的檢視更可以精準有效的產生適時適地的作法。
Bryan
現職資料解決方案架構師,在資料領域打滾十年有餘,協助企業用資料解決商業問題。
常見QA問題
1. 作品的著作權是誰的?
作品的著作權屬於參加團隊所有,不屬於主辦單位或資料提供廠商。唯於本活動中參賽團隊繳交之提案簡報、成果發表之簡報內容,執行單位得用於非獨占性的成果展示、宣傳,不會對參加者支付任何費用。
2. 數據松活動是競賽嗎? 有沒有獎金呢?參加者有什麼好處呢?
本活動的精神在激發創意,並沒有獎金,也不會是解決特定廠商的特定問題。但是可以磨練技巧,發想side project的機會,不僅可以挑戰自我,認識其他開發者,增進團隊默契,更可以透過本活動,接觸到真實應用於業界的高價值資料。若您本身也正在挖掘資料的價值,不妨帶著您自己的問題一起來Brainstorming吧!
3. 我適合參加嗎?一定要組隊報名嗎?
本活動以鼓勵性質為初衷,並不會嚴格規定作品的型態或精準度,歡迎對資料有興趣的人一起玩資料。但為了讓開發進度順利,提醒必須要組隊參加,並且在提案中說明團隊分工腳色。若還是不確定是否合適,也可以先參考各家提供的Sample data,根據欄位先做發想和測試。
4. 參加活動要錢嗎?
本活動為免費報名參加!但為提升活動品質,設有報名團隊數限制,額滿為止,請盡快報名!
5. 活動時間好長,我都要到場嗎?
在取得資料前,需要團隊簽署資料提供廠商的「資料使用及保密同意書」,需要到場才可以拿到資料,第三日的活動發表期間也請務必到場發表。此外活動期間也會有交流時間、免費點心或餐飲,您一定不想錯過!
6. 我想參加活動,要事先準備什麼嗎?
現場備有電源、網路、紙筆,只需要將您開發用的筆電、隊友以及對資料的熱情帶來即可!目前場地並不提供夜宿,可以不用攜帶睡袋。
7. 肺炎疫情是否影響活動呢?
因應疫情,請大家配合量測體溫、噴酒精、戴上口罩,並配合實名制登記。若有疑似症狀請主動通知主辦單位,並得請您離場。若有因疫情調整場地或進行方式,主辦單位會另行通知。