2019-08-01から1ヶ月間の記事一覧

3DPose推定モデル「RepNet」を読んでみました

CTOの幅野です。 CVPR2019で発表された3DPose推定の論文RepNetを解説します。 arxiv.org 概要 2DPoseから3DPoseを推定するモデルを提案した論文です。 本論文では既存モデルは学習データに類似したシーンは3DPoseをうまく推定できるものの、カメラの位置やPo…

Grouped Convolutionのハイパーパラメータを最適化する「clcNet」を読んでみました

インターンの林です。 社内勉強会でclcNetについて発表しました。 arxiv.org 概要 clcNet提案 CDG(Channel Dependency Graph)とCRF(Channel Receptive Field)を新たな分析のツールとして使用 グループ化畳み込みに変わり、新たな畳み込みのIGC(Interlaced Gr…

キーポイント系物体検出モデル その2:「CenterNet: Keypoint Triplets for Object Detection」を読んでみました

CTOの幅野です。 CornerNetを拡張したCenterNetを読みました。 CenterNetは同名で別のモデルが提案されています。 今回はCenterNet: Keypoint Triplets for Object Detectionを解説します。 arxiv.org github.com また、このモデルはCornerNetを拡張したもの…

キーポイント系物体検出モデル その1:「CornerNet: Detecting Objects as Paired Keypoints」を読んでみました

CTOの幅野です。 今回はキーポイント検出手法を利用した物体検出モデルCornerNetを読みました。 arxiv.org 概要 オブジェクトの左上と右下の境界を予測することにより物体検出をする手法を提案 MSCOCOにおいてAP42.2%を達成した。 Corner予測のモチベーショ…

BoudingBoxの小さい物体を検出するモデル「Finding Tiny Faces」を読んでみました

インターンの中村です。 今回はFinding Tiny Facesという論文を読んだので解説していきます。 arxiv.org 概要 非常に小さい顔を検出できる新しいモデルを提案した論文。 また、どうしてそのモデルに至ったのかをImageNetの特性や画像のスケール、物体の周辺…

MobileNet論文その2: 「MobileNetV2: Inverted Residuals and Linear Bottlenecks」を読みました

CTOの幅野です。 今回は高速化アーキテクチャとして広く利用されているMobileNetV2の論文を読みました。 arxiv.org 概要 モバイルで推論させることを考慮したMobilNetV1を拡張したMobileNetV2を提案。 MobileNetV1 では depthwise と pointwise covolution …