データサイエンス ランダムフォレストを用いて音声の声質を分類をしてみる 最近勉強した音声処理の実践を兼ねて、音声の声質(裏声、囁き声など)を分類する決定木モデルを作成していこうと思います。 2022 / 12 / 11 6 min read
データサイエンス OpenAIの新しい音声認識モデル"Whisper"使ってみた 今回はOpenAIから新しい音声認識モデル"Whisper"が公開されたということで色々触ってみることにしました。 2022 / 10 / 03 5 min read
データサイエンス LayoutParserによるレイアウト解析とOCR こんにちは!PlayGroundのデータコースに所属しているtairaとwataruです。今回業務効率化を図るプロジェクトにてLayoutParserを扱ったので紹介していきたいと思います。 2022 / 09 / 27 3 min read
データサイエンス 距離計量学習とSentenceBERT データサイエンスコースのIshihiraです。現在参加している自然言語処理のプロジェクトでSentenceBERTというモデルを使う機会がありました。コース内で開催している深層学習(MLP)の勉強会でたまたま関連する内容を勉強していたので、実際使ってみた結果と合わせて記事にしてみました。 2022 / 09 / 26 3 min read
データサイエンス M1 mac に labelImg を(きれいに)インストールする方法 データコースの yuji です。現在、画像処理のプロジェクトに参加しています。この記事では、M1 mac に labelImg をインストールする手順を紹介します。M1 mac だと単純に pip でインストールしようと失敗してしまいますが、公式リポジトリに M1 mac をサポートしているリリース前バージョンがあるので、手元の環境をいじらずにインストールすることができます。 2022 / 09 / 20 1 min read
データサイエンス Pytorchでピザ判定機を作る こんにちは、Playgroundのデータコースに所属している安藤太一です。昨日ピザを食べたくなったのですが、目の前の食べ物がピザかピザじゃないか分からなくなってしまいました。なので今回はPytorchを用いて画像に写っている物がピザかピザじゃないかを判定する深層学習モデルを作っていこうと思います。 2022 / 07 / 21 11 min read
データサイエンス 【機械学習】Hugging faceの評価指標計算ライブラリ「Evaluate」を使ってみた。 NLPのライブラリ「transformers」などで有名なHugging face社の評価値計算ライブラリ、「Evaluate」を使ってみます。 2022 / 06 / 01 5 min read
データサイエンス 新歓ハンズオン資料編集後記 この記事では、新歓ハンズオン(オンライン開催・オフライン開催)のデータコースで作成した資料や当日についての振り返りをしていきます。 2022 / 05 / 08 3 min read
データサイエンス 最尤推定とクロスエントロピー誤差の関係 機械学習において、多クラス分類などでは、クロスエントロピー誤差を最小化するように学習させることがよくあります。今回、クロスエントロピー誤差を最小化することの統計的な意味について学んだのでそれを記事にしました。 2022 / 04 / 07 3 min read
データサイエンス GANとその実用化 今回は機械学習の中でも深層学習について学習している際によく出てくるGANについての基本的な知識や、そのGANの中でも現在プロジェクトで調査しているGANのことについて述べようと思います。 2022 / 03 / 25 3 min read