DATUM_MLbot's profile picture. DATUMSTUDIO株式会社所属のデータサイエンティストが運営する公式ML論文調査アカウントです。
弊社におけるML界隈の最新技術動向調査の一端を発信していきます。
弊社へのお問い合わせはhttp://datumstudio.jp/contactまでよろしくお願い致します。

また一緒に働いていただける仲間を募集しています!

ML論文調査bot@DATUMSTUDIO

@DATUM_MLbot

DATUMSTUDIO株式会社所属のデータサイエンティストが運営する公式ML論文調査アカウントです。 弊社におけるML界隈の最新技術動向調査の一端を発信していきます。 弊社へのお問い合わせはhttp://datumstudio.jp/contactまでよろしくお願い致します。 また一緒に働いていただける仲間を募集しています!

ML論文調査bot@DATUMSTUDIO أعاد

#技育祭 #ホールB Supershipの講演をご覧いただいた皆さま、PR動画も合わせてご覧ください! youtu.be/pFLAsg0n3dI

supership_jp's tweet card. 技育プロジェクト 2023 Supership PR動画

youtube.com

YouTube

技育プロジェクト 2023 Supership PR動画


ML論文調査bot@DATUMSTUDIO أعاد

#技育祭 #ホールB ご視聴いただきました皆さま、どうもありがとうございました! Supership 2023 Summer internship(就業型インターン)、ぜひご応募ください! hrmos.co/pages/supershi… 本日の講演スライドはこちら speakerdeck.com/supership/2023…


ML論文調査bot@DATUMSTUDIO أعاد

いよいよ明日から #技育祭 ! 明日 14:30からはVPoEの名畑によるセッションを開催します。 talent.supporterz.jp/geeksai/2023sp… ご参加は無料です。申し込みは本日まで!(まだ間に合います) 学生の皆さまのご参加をお待ちしております!

3月18日(土)〜19日(日)開催・学生エンジニア向けテックカンファレンス「技育祭2023(春)」にゴールドスポンサーとして協賛します。初日14:30からはVPoEの名畑によるセッションを開催します。 学生の皆さまのご参加をお待ちしております! supership.jp/news/2023/03/0…



arxiv.org/abs/2112.05135 フラクタル画像を元画像に混ぜ合わせる新しいaugmentation手法pixmixを提案。従来のaugmentationよりも入力変化に対するロバスト性が向上する。ImageNet-Cなどのタスクで安定性を測る複数指標でSOTA。 github.com/andyzoujm/pixm…


semanticstylegan.github.io より細かな画像編集を可能とする生成モデル構築のため、画像とパーツのsegmentation-maskのペアセットを学習データとし、fake画像とfakeマスクを出力する手法を提案。パーツごとに特徴量空間が分かれるため、Stylemixingや潜在空間上の画像編集技術がより細かに制御可能


画像のボケをなくすDEBLURRINGの改善手法。Deblueされた画像を再度、ボケを復元させる操作(Reblue)が、完璧にDeblueされた画像に対しては難しいことに着目し、Deblueをするモデルと別にReblueをするモデルを作成し、Reblueの失敗具合を損失関数としDeblueモデルを学習させる openreview.net/forum?id=kezNJ…


多変量非線形時系列モデルを学習するためにVAEを用いる試みに、さらにモデルに観測不可な入力が存在することを仮定し、モデルと入力の同時推定をする手法iLQR-VAEを提案。非線形最適制御で有名なiLQRとGRUベースのモデルを用いて変分推論し、入力・モデルの同時推論を可能に openreview.net/pdf/2c1adcad1e…


新しい画像タスクのバックボーンの提案論文。UniFormerはConvとViTを統一的に取り扱えるようにしたMulti-Head Relation Attention層を開発し、localとglobalの両情報のバランスを取ったモデルを構築可能とした。計算量を下げつつ精度向上が可能となり、様々なタスクでSOTA arxiv.org/abs/2201.09450


画像生成で重要な、1.画像の高品質化, 2.画像の多様性確保, 3.画像生成の高速化の3点を同時に達成する拡散モデルの提案論文。拡散モデルのノイズ除去過程をConditional GANを用いてモデル化することで、更新ステップ幅を大きく取れるように改善。従来手法から40倍の高速化 arxiv.org/abs/2112.07804


未知のクラスラベルをfewshotの学習設定で増やしていくfew-shot incremental learningにおいては既存手法はその性能調整や再現性に問題があることが知られていた。提案手法では正則化を効かせたロジスティック回帰がSOTAを22%更新することを示した arxiv.org/abs/2110.07059


NVIDIAによる生成モデルを用いた半教師あり学集の最新版。提案手法はクラスラベル付き画像生成のBigGANの出力結果から手動で各クラス5枚ごとの学習データを作成。それを学習して教師画像を生成するBigGANとVQGANを作り、その出力をメインモデルの教師データとして利用する arxiv.org/abs/2201.04684


超解像モデルの軽量化を枝狩りにより実現する研究。通常、超解像モデル中に含まれるresidual connectionの前後のfilter同士が枝刈りされる対象が揃っている必要がある困難さが知られている。提案手法では整列されたスパース化されたモデルを得るための正規化手法を導入 openreview.net/forum?id=zAuDb…


画像からの3次元物体検出を、入力画像から3次元boxel特徴量を介して3次元のkeypoint検出手法として実現した論文。またボクセルに基づく3次元構造の高速高精度な復元手法PCA-SDFを提案し、3次元検出と構造復元の両方を行なうことで精度の向上が見られた。 arxiv.org/abs/2111.03098


ViTが広いタスクに活用可能か汎用性を調査するため、画像のマッチング問題においてのViTを用いた手法を検討。提案するTransMatcharはナイーブなViTが画像マッチング問題に不適当であることを改善するため、decoder側でattentionを用いない実装を構築。既存手法を上回る性能 arxiv.org/abs/2105.14432


提案手法RegGanではPix2Pixで苦手となる教師データのペア画像間の位置ずれや、cycleganにおける精度の向上のための教師なし学習を考案。変形した画像間のマッチングをとるregistrationタスクを解くアーキテクチャとlossを導入し、同時に解くことで精度を向上させた。 arxiv.org/abs/2110.06465


蒸留による小さな物体認識モデルの獲得プロセスは従来は教師用の物体認識から生徒用の物体認識モデルを学習するのが一般的だが、論文では教師用の「画像分類モデル」から物体認識モデルを蒸留する方法を提案。従来手法からの精度向上を報告。arxiv.org/abs/2106.05209


ViTやMLPでは入力画像の大きさに対して2次関数的に計算量が増大する。提案手法では新しいアーキテクチャ内部にパッチ状の入力を変換する2次元離散フーリエ変換と周波数領域での学習可能なフィルターを導入することで複雑度の増大を線形対数レベルに抑えることに成功した。 arxiv.org/abs/2107.00645


画像データとテキストの対照の正誤をとるようなクロスモーダルマッチングの問題に対して、学習データに誤りが含まれるようなより挑戦的な問題設定を検討。学習方法と予測方法のそれぞれに工夫を入れた手法の提案も実施している。 openreview.net/forum?id=S9Zyh…


Loading...

Something went wrong.


Something went wrong.