作本くんが言語処理学会第29回年次大会にてポスター発表を行いました。

2023年03月14日

長岡技科大の博士課程の作本くんが言語処理学会第29回年次大会にて「類似データセット発見課題における詳細なデータセット分類に基づいた有効性の評価」と題したポスター発表を行いました。

本研究は科研費基盤B研究「データ流通市場のダイナミクスの解明と制度設計(20H02384)」の研究の一つで、異種のデータセットを分野を横断した探索と発見を促進するためのデータセット分類手法と評価方法を提案しています。分野横断的なdataset discoveryは異分野データ協創においてニーズが高まっており、本研究のアプローチは来たるデータ社会の実現の一助となると考えています。

タイトル:類似データセット発見課題における詳細なデータセット分類に基づいた有効性の評価

著者:作本猛(長岡技科大), 早矢仕晃章(東大), 坂地泰紀(東大), 野中尋史(愛工大)

概要:近年のコンピュータ技術の発展に伴い,互いに類似するデータセットを発見するための方法が盛んに研究されているが,従来研究ではデータセットを探索する個々のユーザのニーズを反映するような評価項目が用いられてこなかった.そこで,本研究では,類似データセット発見手法の評価において,データプラットフォームで実際に用いられている分類基準に基づいた4種類の詳細な項目を評価に適用した.その結果,変数ラベル間のDice係数を用いた手法が,課題やメイントピックが完全に一致するデータセットの探索に有用であることが示された.