Faster R-CNNの入力サイズにつてい

Question

HY on 25 Feb 2021

0
Link

Direct link to this question

https://in.mathworks.com/matlabcentral/answers/755824-faster-r-cnn

Commented: Kenta on 28 Feb 2021

こんにちは。

Faster R-CNNを学習させようとしています。こちらのドキュメント(Faster R-CNN 深層学習オブジェクト検出器の学習 - MATLAB trainFasterRCNNObjectDetector - MathWorks 日本)を実際に実行してネットワークの入力サイズを確認したのですが、32×32×3でありかなり小さいサイズでした。

入力サイズがその値ということは、車の映る画像全体を32×32にリサイズしてネットワークに入力し、その後RPNで車のみをプーリングし分類＋検出すると思うのですが、物理的に入力サイズが小さすぎませんでしょうか。しかし、ドキュメントではこの値で精度良く検出できていて不思議です。

逆にこちらのドキュメント(Faster R-CNN 深層学習の検出器を使用したオブジェクトの検出 - MATLAB - MathWorks 日本)では、Resnetを使用しており入力サイズが224×224であり、かなりサイズが違います。物理的な大きさで言えばこちらの方が特徴が学習しやすいように感じます。

そもそもこの２つのドキュメントですが、タイトルが違うものの検出器を学習させ最後にオブジェクトを検出しているので、行っていることは同じでしょうか？

最後に32×32のような人間が見ても特徴がわからないサイズで物体検出できている理由が知りたいです。

勉強不足で申し訳ありませんが、よろしくお願いいたします。

0 Comments
Show -2 older commentsHide -2 older comments

Sign in to comment.

Sign in to answer this question.

Answer 1

Kenta on 28 Feb 2021

0
Link

Direct link to this answer

https://in.mathworks.com/matlabcentral/answers/755824-faster-r-cnn#answer_635379

３２×３２のほうはあくまで例として用意されていて、実質はより大きな画像サイズで試すべきなのだと思います。３２×３２にしても、ぼやっと車のピクセルなどが存在するので、今回はそれをうまく拾える場合が多いので検出自体はできる、くらいの理解でよいのではないでしょうか。faster RCNNはそれなりに計算時間がかかるので、小さいサイズにして試しやすくしているのかな、と思っていました。手元のデータで試すときは、おおよそ224×224以上の入力サイズで実行されてはいかがでしょうか。

2 Comments
Show NoneHide None

HY on 28 Feb 2021

kenta様

再度回答していただきありがとうございます。そうですね、車くらいの特徴でしたら32*32でも問題なさそうですね。

度々質もしてお申し訳ありません。納得いきました。

ありがとうございました。

Kenta on 28 Feb 2021

いえいえ、参考になったようで幸いです。

Sign in to comment.

Faster R-CNNの入力サイズにつてい

0 Comments
Show -2 older commentsHide -2 older comments

Accepted Answer

2 Comments
Show NoneHide None

More Answers (0)

See Also

Categories

Tags

Community Treasure Hunt

Faster R-CNNの入力サイズにつてい

0 Comments Show -2 older commentsHide -2 older comments

Accepted Answer

2 Comments Show NoneHide None

More Answers (0)

See Also

Categories

Tags

Community Treasure Hunt

0 Comments
Show -2 older commentsHide -2 older comments

2 Comments
Show NoneHide None