HACS (Human Action Clips and Segment )データセットは、アクションセグメントのビデオを使用して、認識と時間的ローカリゼーションを扱うモデルの構築に適したCVデータセットです。大規模な画像認識/分類、オブジェクト検出、セグメンテーション、およびキャップです。

詳細を見る

Waymoは、25都市で1,000万を超える自律走行距離を収集し、高品質のマルチモーダルセンサーデータセットを公開しました。サイズとカバレッジに加えて、このデータセットには、多様な運転環境、詳細なラベリング、360度ビュー、2Dおよび3D知覚、ドメイン適応、シーン理解、行動予測に適したカメラとライダーの同期も含まれています。

詳細を見る

自動運転車における非常に優れたソースとなるレベル5向けのデータセットには、55,000を超える人間が付与したラベルがついています。3D注釈付きフレームおよび、表面マップ、7個のカメラ、最大3個のLidarセンサーでキャプチャされた、基盤となるHD空間セマンティックマップが含まれ、コンテキスト化に使用できます。なお、このデータセットはnuScenes形式でされるのでご留意ください。

詳細を見る

2016年にv1で最初に導入されたGoogleのオープンイメージは、2019年に新しいセグメンテーションマスクとインスタンスセグメンテーションに重点を置いて更新されています。Open Images V5は、350のカテゴリーの280万のオブジェクトインスタンスのセグメンテーションマスクを備えています。マスクに加えて、人間が検証した新しい画像レベルのラベル640万個を追加し、20,000を超えるカテゴリで合計3650万個に達しています。このデータセットは、オブジェクト検出モデルの構築に非常に適しています。

詳細を見る

ドローンシステムとテクノロジーのリーダーの1つであるParrotは、エンジニアリング、建設、農業におけるユースケースに適したさまざまな空中自律走行機のトレーニングに使用できる空中からの優れたビデオのコレクションを提供しています。

詳細を見る

COCO(Common Objects in Context)とは、大規模な画像認識/分類、オブジェクト検出、セグメンテーション、キャプションのデータセットです。次のようなデータを含んでいます。
330,000画像(200,000 +注釈付き)
キーポイントを持った250,000人による1画像あたり5つのキャプションを備えた、80ポイントのオブジェクトカテゴリで200万を超えるインスタンスがあります。