FFA-Net:ネットワークスタックFusionの注意を引く単一画像の単一画像デヘイズのための特徴融合注意ネットワーク(AAAI 2020)



Ffa Net Wherein Feature Fusion Attention Network



スタックへの単一の画像の場合 注意ネットワーク機能の融合

https://arxiv.org/pdf/1911.07559.pdf



Xu Qin1 * Zhilin Wang2 ∗ Yuanchao Bai1XiaodongXie1†HuizhuJia1
1北京大学電子工学・コンピュータサイエンス学部
2北京航空航天大学コンピュータサイエンス工学部
{qinxu、yuanchao.bai、donxie、hzjia} @ pku.edu.cn、root @ xxxxx

このペーパーはエンドツーエンドを提案します ネットワーク機能の融合に注意してください (FFA-Net)、直接回復のための霧のない画像。 3つの主要コンポーネントで構成されるFFAネットワークアーキテクチャ:1)異なるチャネル特性を考慮すると、異なる重み付け情報が含まれ、ヘイズは画像ピクセルの不均一な分布とは異なります。 新機能(FA)モジュールに注意してください 、意志 チャネルに注意してくださいピクセルに注意してください メカニズムの組み合わせ。 さまざまな機能とピクセルのFA不均等な処理 これにより、さまざまなタイプの情報を処理するための追加の柔軟性、CNN表現を拡張する機能が提供されます。 2)基本ブロック構造の 残りの機能とローカル構成の学習に注意してください ローカルバイパス接続により、残りの残りの学習は、複数のミストまたは低周波ローカル領域を介して重要性の低い情報を学習できるため、メインのネットワーク構造はより効果的な情報に関係します。 3) さまざまなレベルのノートの統合機能(FFA)構造に基づく 特徴(FA)モジュールのアダプティブラーニング特徴の重み、重要な特徴により多くの重みが与えられることに注意してください。 この構造はまたすることができます浅い情報を予約して深いところに渡す。その結果、私たちが提案した量と質のFFANetは、既存の単一画像オーバーオーバー法よりもはるかに高く、SOTS屋内テストデータセットで公開されているPSNRインデックスは30.23db35.77dbから増加することが示されました。コードはされています https://github.com/zhilin007/FFA-Net 提供します。



過去数十年にわたる基本的な低レベルのビジョンタスクとしてのスタックへの単一の画像は、ますます多くのコンピュータービジョンと人工知能コミュニティの注目を集めています。

大気中に煙、ほこり、煙、霧、その他の浮遊粒子が存在するため、このような画像ピックアップ大気では、色の歪み、ぼやけ、その他の低コントラストの可視品質の劣化や薄暗い画像の影響を受けることがよくあります。画像入力は、再テストや解決が難しいその他の視覚的タスクを分類、追跡、識別、および対象とします。したがって、損傷した画像を鮮明な画像に復元する目的で積み重ねる画像。この前処理ステップは高度な視覚的タスクになります。大気散乱モデル(CARTNEY 1976)(Narasimhan and Nayar 2000)(Narasimhan and Nayar 2002)は、単純な近似霧効果を提供し、次のように表されます。



ここで、I(z)は、かすんでいる観察された画像であり、全球大気光、t(z)は、図J(z)のかすみのない画像の転写媒体である。さらに、t(z)=e-βd(z)を取得します。ここで、βとd(z)は大気の散乱パラメータと被写界深度です。大気散乱モデルは、Aとt(z)を知らなくても、画像が劣決定問題に積層されていることを示しています。式(1)は次のように表すことができます。

式1と式2から、全球大気と透過計画を正しくぼかす画像キャプチャを推定すると、曇りのない鮮明な画像を復元できることがわかります。大気散乱モデル、仕事をするための多くの方法を早期に積み重ねる(Berman、Avidan et al。、2016)(Fattal、2014 Nian)(He、Sun and Tang、2010)(Jiang et al。、2010)。 2017)(Ju、Gu and Zhang、2017)(Meng et al.2013)(Zhu、wheat、Shao 2015)。 DCPは、アプリオリに基づく優れた方法であり、屋外タイルに基づいています。ヘイズのない画像は、提案された暗闇の前に少なくとも1つのチャネルでチャネルの強度値が低くなる傾向があると想定されます。ただし、実際の使用では従来の方法が壊れやすいため、伝送図の推定が不正確になる可能性があり、実際には事前の方法がうまく機能しない場合があります。学習の深さが増すにつれて、DehazeNet(Caiet。2016)、マルチスケールCNN(MSCNN)(Ren et al .2016)の先駆的な研究を含む、ヘイズ効果を推定するための多くのニューラルネットワークも発生しました。 、残りの学習テクノロジー(He etal。2016)、クアッドツリーCNN(Kim、Ha、およびKwon 2018)、およびネットワークに接続された高密度ピラミッドスタック(Zhang and Patel 2018)。従来の方法と比較して、深度学習方法は、ヘイズ回帰なしでFIG中間または最終画像を直接送信しようとします。大規模なデータを適用することで、優れたパフォーマンスの堅牢性を実現します。このホワイトペーパーでは、スタックコンバージドネットワーク(略してFFAネットワーク)の最後までの単一イメージの新機能について説明します。前の画像からCNNネットワークスタックに基づいて、ピクセルのチャネル特性の処理は同じですが、ミスト分布の画像は均一ではなく、ミストの重みはピクセルの厚い領域の重みと大幅に異なります。霧。さらに、DCPは、少なくとも1つのカラー(RGB)チャネルでは、強度が非常に低いピクセルの数が非常に一般的であることもわかりました。これは、チャネルのさまざまな機能が完全に異なる重み付け情報を持っていることをさらに示しています。それを平等に扱った場合、重要でない情報の不要な計算に多くのリソースが必要になり、ネットワークはすべてのピクセルとチャネルをカバーする機能を欠きます。最後に、ネットワークの表現が大幅に制限されます。自己注意メカニズム(Xu etal。2015)(V aswani etal。2017)(Wang et al .2018)は、ニューラルネットワークの設計に広く使用されており、ネットワークのパフォーマンスが重要な役割を果たしました。作品(Zhang et al .2018)に触発されて、私たちはさらに新しい機能的懸念(FA)モジュールを設計しました。それぞれチャネル特性とピクセルに関するFAモジュールであり、チャネルアテンションピクセルアテンションを組み合わせます。さまざまな機能とピクセルのFA不均等な処理。これにより、さまざまなタイプの情報をより柔軟に処理できます。

合併snet(彼は待っていました。2016年)。これにより、非常に詳細なトレーニングネットワークが可能になります。設計された基本モジュールと考えられるジャンプおよび接続メカニズムの使用は、学習およびその注意の複数のローカルジャンプ残りの機能によって接続されることに留意されたい。一態様では、複数の局所残留ミストバイパス領域および低周波情報を学習することによる局所残留学習、より有用な情報を学習するための主要なネットワーク。 FFAネットワークのパフォーマンスをさらに向上させるために関係するチャネル。ネットワークの深化に伴い、浅い特性情報の保存が困難になることがよくあります。さまざまなレベルの統合と機能を特定するために、U-Net(Ronneberger、Fischer、およびBrox、2015年)およびその他の浅い情報と深い情報のネットワーク統合の取り組み。同様に、注意の特徴融合(FFA)に基づく構造を提案します。この構造は、情報を保持し、それを浅い深さに渡すことができます。最も重要なことは、入力特徴融合モジュールのすべての特性の前にFFAネットワークがあり、特徴のさまざまなレベルにさまざまな重みを与えることです。重みは、取得したFAのアダプティブラーニングモジュールを介して行われます。これは、重量が直接のものよりもはるかに優れていることを示しています。さまざまなネットワークのノイズ除去のパフォーマンスを評価するために、従来のPSNR(PSNR)と構造的類似性インデックス(SSIM)を使用して、画像のノイズ除去回復の品質を定量化します。主観的な評価のために、多数のネットワーク出力も提供しています。私たちは、FFAネットワークの有効性に加えてベンチマークデータセットにスタックされていることを検証するために広く使用されています(Li et al.2018)。 PSNRおよびSSIMメトリックは、最新の以前のアプローチと比較されました。実験によると、定性的および定量的なFFAネットワークは、従来の方法よりもはるかに優れています。さらに、多くのアブレーション実験があり、FFAネットワークの主要メンバーが優れた特性を持っていることが証明されています。全体として、私たちの貢献は次の4つのポイントです。

バンドルコンバージドネットワークFFAネットワークに注目するために、シングルエンド機能の新しいイメージを提案しました。 FFAネットワークは、特に大きなヘイズ、特に豊かなテクスチャの詳細領域で、最も高度な方法と重複するために、前の画像を大幅に超えています。図1に示すように。図1と図8では、復元された画像の詳細があり、色の忠実度にも大きな利点があります。

チャネルアテンションとピクセルアテンションメカニズムを組み合わせた新しい注目機能(FA)モジュールを提案します。このモジュールは、さまざまなタイプの情報、より注意を引くピクセルフォグ、およびより重要な情報チャネルを処理する際の柔軟性を高めます。

基本ブロックで構成される残りの部分機能(FA)によって調査と注意を払いました。ローカル学習により、残りのマルチホップ接続が可能になり、メモ(FA)で特徴付けられる低周波領域情報ミストがバイパスされてさらに改善されます。 FFAのネットワークの容量。

情報を保持し、それを浅い深さに渡すことができる特徴融合ベースの注意(FFA)構造を提案します。さらに、すべての機能を統合できるだけでなく、さまざまなレベルの機能情報の重みでさまざまな重みを適応的に学習することもできます。最後に、より良いパフォーマンスを達成した他の機能融合方法と比較して。

従来の画像曇り除去法は、主に式1の物理的散乱モデルの開発に依存しています。これは、未知の透過図と全球大気光のために非常に不適切な問題です。これらの方法は大きく2つのカテゴリーに分けることができます:以前の学習方法に基づく伝統的な方法と現代的な方法です。いずれにせよ、重要なのは透過マップと大気光の問題を解決することです。従来の方法では、さまざまな統計的事前画像に基づいて、情報破損プロセスの損失を補うための追加の制約として使用します。 DCP(He、Sun、およびTang 2010)は、図1の送信のための先験的な暗チャネルを推定する方法を提案している。ただし、大気光学シーンが以前の情報と同様にオブジェクト化されている場合、それは信頼できません。 (Zhu、Mai、Shao 2015)線形モデルを作成することにより、シーンのぼやけた画像の深さをモデル化し、シンプルでありながら強力なカラーフォールを事前に提案します。 (Fattal 2008)は、光透過の薄暗いシーン推定の新しい方法を提案しました。散乱光を除去してシーンの視認性を高め、シーンのコントラストはヘイズのない回復です、(Berman、Avidan et al。、2016)は提案します。アルゴリズムがカラーフォグ画像に依存していると仮定して、非局所性は、きれいな画像を特徴付ける方法であり、何百もの異なる色によって十分に近似され、それによってRGB空間に密集したものを形成します。これらの方法は一連の成功を収めていますが、先験的な方法であり、野生の制約のない環境など、すべてのケースを処理できるわけではありません。大規模な画像データセットの詳細な研究における画像処理タスクの広範な成功と利用可能性を考慮して、(Cai et .2016)は、複雑から複雑なネットワークモデルへのエンドベースの畳み込みニューラルネットワークを提案しました。図の伝送媒体、大気散乱モデルを出力し、次に薄暗い画像復元を使用します。 (Ren etal。2016)マルチスケールMSCNNを使用して、ぼやけた画像から正確な透過マップを実行できます。 (Y ang and Sun 2018)は、従来の優先度ベースの方法の利点と、以前はネットワークの深さまでヘイズに関連した学習である深さ学習をスタックすることを組み合わせたものです。 。 (Li etal。2017)軽量CNNを介したAODネットワークは、クリーンな画像を直接生成します。この斬新な設計により、エンドAODを他のネットワーク深度モデルに簡単に組み込むことができます。人工選択前処理法とマルチスケール推定を使用したゲート収束ネットワーク(GFN)(Ren etal。2018)は、本質的に一般的であり、これらの方法を改善する必要があります。 (Chen et al .2019)ゲーティングエンドコンテキストのヘイズフリーの最終画像復元集約ネットワーク。ネットワークは最新のテクノロジーのスムーズな拡張を使用して、拡張畳み込みによって生成されたグリッドアーティファクトが広く使用されているため、無視できる余分なパラメーターを削除します。 EPDN(Qu etal。2019)は、組み込みネットワークに対する抵抗を生成し、その後、物理的散乱モデルに依存せずに設計されたブースターが続きます。

このセクションでは、アテンションネットワーク機能の融合FFA-Netに焦点を当てます。入力FFAネットワーク2はぼやけた画像であり、浅い特徴抽出セクションに転送され、マルチホップ接続を持つNグループ構造に入力され、アテンションモジュールの特徴によってN出力の構造が生成されます。特性グループをまとめると、最終的な再構成セクションのこれらの特性がグローバル学習残差構造に送信され、霧のない出力が得られます。さらに、基本ブロックBの各セットの構造は、結合された研究を残した部分構造であり、各基本ブロックは接続されており、ジャンプノート(FA)モジュールの結合が行われている。 FAは、注意チャネルで構成される注意および注意ピクセル構造です。

注(FA)で、チャネルネットワークスタック上のほとんどの画像処理に特徴があり、ピクセルが等しい場合、処理を不均一に分散させることはできず、画像チャネルの重み付けのかすみがあります。

正常に機能しています。チャネルの注意とピクセルで構成される注意による特徴的な注意(図3を参照)。これにより、さまざまなタイプの情報をより柔軟に処理できます。さまざまな機能とピクセル領域のFA不均等な処理。これにより、さまざまなタイプの情報を処理する際の柔軟性が高まり、CNNの能力を表すように拡張できます。ピクセルとチャネルの特性ごとに異なる重みを生成することは、どれほど重要なステップです。当社のソリューションは次のとおりです。

チャネルノート(CA)チャネルは、DCPのさまざまなチャネル特性に焦点を当てており、重み付け情報が完全に異なります(He、Sun、およびTang2010)。まず、グローバル平均プールを使用したグローバル空間チャネル情報がチャネル記述子に変換されます。

Xc(i、j)はcチャネルの値を表しますXcat位置(i、j)はですが、Hpisはグローバルプールの関数です。 C×H×WによるFIG形状の特徴はC×1×1になります。2つの層とシグモイドの畳み込みによって特徴付けられる異なるチャネルの正しい値を取得するために、活性化関数後のReLu。

ここで、σはシグモイド関数、δはReLu関数です。最後に、CAcfcチャネルの重みを掛けて入力します。

最後に、fcチャネルCAcの重みを掛けて入力します

画像ピクセルの異なるヘイズの不均一な分布を考慮したピクセル(Pixel Attention、PA)に注意してください。厚いヘイズなど、ネットワークにより多くの注意情報があることを特徴とする、注目のピクセル(Pixel Attention、PA)モジュールを提案します。ピクセル周波数の高い画像領域。

CAと同様に、ReLu入力シグモイド活性化関数F *(出力CA)を使用して、C×H×Wが1×H×Wの形で2層の畳み込みに直接入力されます。

最後に、入力要素F *とPAで乗算を使用します。 Future Attention(FA)出力モジュールです。

注意(FA)メカニズムの有効性を視覚的に説明するために特徴付けられて、我々は、図1の出力セットの構造のピクセルレベルおよびチャネルレベルの特徴の重みを印刷する。さまざまな特徴マップがさまざまな重みで適応的に学習していることがはっきりとわかります。図4は、ピクセル領域の厚みのあるぼやけた画像で、重みが大きく、オブジェクトのエッジ、テクスチャが示されています。ピクセル(PA)メカニズムにより、ネットワークはFFAの高密度ピクセル領域により注意を向けるようになります。図5は、3×64のFIGサイズを示し、重みの出力のチャネル方向のアーキテクチャにおける3本の線の3つのグループに対応する特徴の重みのマッピングは、完全に異なる重みを適応的に学習するさまざまな特徴を示しています。

基本ブロック構造 6、ローカルおよび残りの研究注意(FA)モジュールによって特徴付けられる基本ブロック構造、複数のローカル残余学習により、ローカル接続がミストまたは低周波数領域などの残りの重要性の低い情報をバイパスできるようになり、プライマリネットワークに焦点が当てられます効果的な情報について。実験結果は、構造がネットワーク性能および安定性トレーニングをさらに改善できることを示しており、局所的な残余学習効果を図3に見ることができる。 7、詳細は部分的にアブレーション研究で見ることができます

グローバルアーキテクチャグループと残りのグループは、ブロック構造Bを使用して基本アーキテクチャを学習し、接続モジュールをスキップします。連続したBは、深さと表現のFFAネットワークの増加をブロックします。ジャンプFFAネットワーク接続はトレーニングを困難にします。最後のFFAネットワークでは、高速畳み込みネットワークの2つの層を使用し、グローバル学習モジュールが回復の残りの部分を追加します。最後に、霧のない画像を復元したいと思います。

機能の融合に注意してください 上記のように、まず、マッピング構造から出力されるグループGの機能をチャネル方向に接続します。さらに、統合機能によって特徴付けられる注意(FA)メカニズムの重みを再び乗算することによって得られるアダプティブラーニング。このように、重量メカニズムにより、低レベルの情報を保持して深部に渡すことができ、ネットワークは、効果的な情報FFAの厚い霧の領域、高周波のテクスチャ、色の忠実度などにより注意を向けることができます。

損失関数 平均二乗誤差(MSE)またはL2損失は、単一画像損失関数をスタックするために最も広く使用されています。ただし、(Lim et al。(2017)は、PSNRおよびSSIMインジケーターで、多くのL1が画像回復タスクトレーニングを失い、L2よりも優れたパフォーマンス損失を達成したことを指摘しました。同じ戦略に従って、単純なデフォルトのL1損失があります。多くのスタックアルゴリズムが使用され、認識される損失GAN損失ですが、L1損失最適化を選択しました。

ここで、ΘはFFAネットワークパラメータを表し、igtは真のマークを表し、ihazeは入力を表します。

実装の詳細 このセクションでは、提案されているFFAネットワークの実装の詳細について詳しく説明します。グループ構造Gは番号3です。各グループの構造、B = 19に設定した基本ブロック構造の番号。チャネル1×1の注意に加えて、すべての畳み込みフィルター層のサイズは3×3です。 。チャネルアテンションモジュールに加えて、すべての機能チャートは同じサイズのままです。出力フィルタ64の各グループ構造。

データセットと指標 (Li et al .2018)は、ハウススタックへの参照画像を提案しました。ブラー画像は、深度データセット(NYU深度V2(Silberman et al。)In。、およびステレオデータセット(Middlebury)からの合成屋内および屋外シーンで構成されています。ステレオデータセット(Scharstein and Szeliski 2003))RESIDE屋内トレーニングセットには、1399 13990のぼんやりとした画像のクリーンな画像と、対応するクリーンな画像で生成された0.8〜1.0の全球大気照明範囲、および.04〜0.2の散乱パラメータが含まれています。いくつかの新しい方法を比較しました。PSNRとSSIMの指標を使用し、ターゲットテストの合成に焦点を当てた包括的な比較テストには500の屋内と500の屋外の画像画像が含まれます。主観的な評価結果のリアリズムのぼやけた画像もテストしました。

トレーニングセット FFAは、RGBチャネルでネットワークをトレーニングし、90,180,270のランダム回転と水平フリップを使用して、トレーニングデータセットを拡張します。サイズ240×240の2つのぼやけた画像ブロックをFFAネットワーク入力として抽出します。ネットワークトレーニングステップ全体で5×105。デフォルト値の0.9と0.999からそれぞれβ1とβ2であるAdamオプティマイザーを使用します。初期学習率は1×10-4に設定され、戦略コサインアニーリング(He et al .2019)コサイン関数学習率は初期値0から調整されます。バッチの合計がTであるとすると、ηは初期収益率です。次に、バッチT、ηTの学習率は次のように計算されます。

PytTorch(Paszkeetal。RTX2080TiGPUを使用してモデルを実現します。)

常駐データセットの結果

このセクションでは、過去の量的側面と質的側面の両方、および最も高度なネットワークFFA画像をスタックアルゴリズムと比較します。 DCP、AODネットワーク、DehazeNet、GCANetの4種類の最新のスタックアルゴリズムを比較して、表1の結果を比較します。

(A)屋内と屋外の結果

定性的なSOTSのぼやけた画像と比較の実際のテストセット:8

便宜上、参考文献(Li et al。および(Qu etal。2019)を見ることができます。私たちのネットワークのパフォーマンスは、提案されたFFAよりも優れています-....芸術的方法にはPSNRとSSIMの点で大きな利点があります。 、また、図8の視覚効果を定性的な比較のために比較しました。

屋内と屋外の結果から、上位3行は屋内の結果であり、屋外は次の3行の結果です。 DCPは、その潜在的な先験的な仮定により、深刻な色の歪みが発生し、それによって画像の奥行きの詳細が失われることがわかります。 AODネットワークはヘイズを完全に除去することはできず、低輝度画像を簡単に出力します。対照的に、明るさのグラウンドトゥルースに関してDehazenetが復元した画像は高すぎます。高周波ディテールテクスチャ、エッジなどのGCANetパフォーマンス情報処理能力。青い線5は不十分でした。実際のぼやけた画像の結果については、私たちのネットワークは、画像が迫っている塔の深さの最初の線を魔法のように見つけることができます。さらに重要なことに、私たちのネットワークは、2列目のテクスチャの濡れた雨滴などの実際のシーン情報の結果とほぼ完全に一致しています。ただし、GCANEの建物の表面に存在しないスポットが見つかったため、行2になりました。別のネットワークイメージからの復元では不十分です。実際の画像の詳細と色の忠実度に関する当社のネットワークパフォーマンスは、他のネットワークよりも優れています。

アブレーション分析

FFAネットワーク構造の優位性をさらに証明するために、提案されたFFAネットワークアブレーションのさまざまなモジュールが研究されたことを考慮に入れます。これらの要因に焦点を当てます:1)FA(特性注記)モジュール。 2)残りのローカライズされた学習(LRL)とFAをバインドします。 3)融合する構造に注意してください。入力として48×48の画像、トレーニングステップ3×105、その他の構成を実装の詳細と同じにカットします。結果を表2に示します。この記事の実装の詳細を利用すると、PSNRは35.77dbに達します。結果は、これらの各要因が、私たちが検討するネットワークパフォーマンス、特にFFA構造に大きな影響を与えることを示しました。また、FAの構造だけを使ったとしても、私たちのネットワークはこれまで以上に先進的な方法で大きな競争になることもはっきりとわかります。ネットワークパフォーマンスを向上させながらLRLを実行し、トレーニングをより安定させます。機能と統合メカニズム(FFA)のFAの組み合わせにより、私たちの研究は非常に高いレベルに達しました。

結論このホワイトペーパーでは、エンドツーエンドのネットワーク統合機能について説明し、スタックへの単一のイメージでその強力な機能を示しました。私たちのFFAは単純なネットワーク構造ですが、従来技術の方法に比べて大きな利点があります。私たちのネットワークは、画像の詳細と色の忠実度の復元に関して強力な利点を回復し、ノイズ除去、超解像、ノイズ除去などの他の低レベルの視覚タスクに対処することが期待されています。 FFA FFAおよびその他の効果的なネットワークモジュールは、画像復元アルゴリズムで重要な役割を果たします。

参考文献
[Berman、Avidan、その他2016] Berman、D。Avidan、S。
etal。 2016.非ローカル画像の曇り除去。の議事録で
コンピュータビジョンとパターン認識に関するIEEE会議-
nition、1674〜1682。
[Caietal。2016] Cai、B。Xu、X。Jia、K。Qing、C。and Tao、
D. 2016. Dehazenet:単一のim-のためのエンドツーエンドシステム
年齢ヘイズ除去。画像処理に関するIEEEトランザクション
25(11):5187–5198。
[Cartney 1976] Cartney、E。J.1976。大気の光学-
球:分子および粒子による散乱。ニューヨーク、
John Wiley and Sons、Inc.、1976。421p。
[Chen etal。 2019] Chen、D。He、M。Fan、Q。Liao、J。
Zhang、L。Hou、D。Y uan、L。and Hua、G.2019。ゲート付き
画像の曇り除去とドランのためのコンテキスト集約ネットワーク-
ing。 2019年のIEEEWinter Conference on Applications of of
コンピュータビジョン(WACV)、1375〜1383。 IEEE。
[Fattal 2008] Fattal、R.2008。単一画像の曇り除去。 ACM
グラフィックに関するトランザクション(TOG)27(3):72。
[Fattal 2014] Fattal、R.2014。カラーラインを使用した曇り除去。
グラフィックスでのACMトランザクション(TOG)34(1):13。
[彼等。 2016]彼、K。チャン、X。レン、S。およびサン、J.2016。
画像認識のための深い残余学習。進行中-
コンピュータビジョンとパターンに関するIEEE会議の報告
認識、770〜778。
[Heetal。2019] He、T。Zhang、Z。Zhang、H。Zhang、Z。Xie、
J. and Li、M.2019。画像分類のためのトリックのバッグ
畳み込みニューラルネットワークを使用します。の議事録で
コンピュータビジョンとパターン認識に関するIEEE会議-
、558–567。
[He、Sun、and Tang 2010] He、K。Sun、J。and Tang、X。
2010.以前のダークチャネルを使用した単一画像のヘイズ除去。
パターン分析とマシンインテリジェンスに関するIEEEトランザクション
gence 33(12):2341–2353。
[江ら。 2017]江、Y。 Sun、C。Zhao、Y。とアン、
L.2017。適応型バイチャネル事前分布を使用した画像の曇り除去
スーパーピクセルで。コンピュータビジョンと画像理解
165:17–32。
[Ju、Gu、およびZhang 2017] Ju、M。Gu、Z。およびZhang、D。
2017.改善されたat-に基づく単一画像のヘイズ除去
大気散乱モデル。ニューロコンピューティング260:180–191。
[キム、ハ、クォン2018]キム、G。ハ、S。とクォン、J。
2018.適応パッチベースの畳み込みニューラルネットワーク
堅牢な曇り除去用。 2018年に第25回IEEEInternational Con-
画像処理に関する会議(ICIP)、2845–2849。 IEEE。
[Lietal。2017] Li、B。Peng、X。Wang、Z。Xu、J。およびFeng、
D. 2017. Aod-net:オールインワンのヘイズ除去ネットワーク。プロで-
コンピュータに関するIEEE国際会議の議事録
ビジョン、4770〜4778。
[Li etal。 2018] Li、B。Ren、W。Fu、D。Tao、D。Feng、D。
Zeng、W。およびWang、Z.2018。単一画像のベンチマーク
曇りを取り除き、それを超えて。画像処理に関するIEEEトランザクション-
ing 28(1):492–505。
[Lim etal。 2017] Lim、B。Son、S。Kim、H。Nah、S。および
Mu Lee、K.2017。罪のための強化された深い残余ネットワーク-
gle画像の超解像。 IEEE会議の議事録
コンピュータビジョンとパターン認識作業に関する会議-
ショップ、136〜144。
[Mengetal。2013] Meng、G。Wang、Y。Duan、J。Xiang、S。
and Pan、C.2013。境界を伴う効率的な画像の曇り除去
制約とコンテキストの正則化。の議事録で
コンピュータビジョンに関するIEEE国際会議、617–
624。
[Narasimhan and Nayar 2000] Narasimhan、S。G.、and Na-
yar、S。K.2000。視覚のための色彩的枠組み
悪天候。議事録IEEEConference on Com-
puterビジョンとパターン認識。 CVPR 2000(カタログ番号
PR00662)、第1巻、598〜605。 IEEE。
[Narasimhan and Nayar 2002] Narasimhan、S。G.、and Na-
yar、S。K.2002。ビジョンと雰囲気。インターナショナル
Journal of Computer Vision 48(3):233–254。
[Paszke etal。 2017] Paszke、A。Gross、S。Chintala、S。
Chanan、G。Yang、E。DeVito、Z。Lin、Z。Desmaison、A。
Antiga、L。and Lerer、A.2017。自動微分
pytorch。
[Qu etal。 2019] Qu、Y。チェン、Y。 Huang、J。およびXie、Y。
2019.強化されたpix2pixデヘイズネットワーク。進行中-
コンピュータビジョンとパッティングに関するIEEE会議の報告
アジサシ認識、8160〜8168。
[Ren etal。 2016] Ren、W。Liu、S。Zhang、H。Pan、J。Cao、
X.とYang、M.-H。 2016.マルチを介した単一画像の曇り除去-
畳み込みニューラルネットワークをスケーリングします。ヨーロッパの会議では-
コンピュータビジョン、154–169。スプリンガー。
[Ren etal。 2018] Ren、W。Ma、L。Zhang、J。Pan、J。Cao、
X. Liu、W。およびY ang、M.-H。 2018.単一画像の曇り除去のためのゲート融合ネットワーク。 IEEECon-の議事録
コンピュータビジョンとパターン認識に関する会議、3253–
3261。
[Ronneberger、Fischer、およびBrox 2015] Ronneberger、O。
フィッシャー、P。 and Brox、T。2015. U-net:畳み込み
生物医学画像セグメンテーションのためのネットワーク。インター-
医用画像コンピューティングに関する全国会議と
コンピュータ支援介入、234–241。スプリンガー。
[Scharstein and Szeliski 2003] Scharstein、D。、およびSzeliski、
R.2003。構造化を使用した高精度ステレオ深度マップ
光。 2003年にIEEEComputer Society Conference on Com-
puter Vision and Pattern Recognition、2003年。議事録。、
第1巻、I–I。 IEEE。
[シルバーマンら。 2012]シルバーマン、N。ホイエム、D。コーリ、P。
and Fergus、R.2012。屋内セグメンテーションとサポート推論-
rgbd画像からのence。 Com-に関するヨーロッパ会議で
puter Vision、746–760。スプリンガー。
[V aswani etal。 2017] V aswani、A。Shazeer、N。Parmar、N。
Koreit、J。Jones、L。Gomez、A。N。Kaiser、L。およびPolo-
sukhin、I.2017。必要なのは注意だけです。の進歩で
神経情報処理システム、5998–6008。
[Wang etal。 2018] Wang、X。Girshick、R。Gupta、A。and
彼、K.2018。非ローカルニューラルネットワーク。議事録
コンピュータビジョンとパターンに関するIEEE会議の概要
認識、7794〜7803。
[Xu etal。 2015] Xu、K。Ba、J。Kiros、R。Cho、K。Courville、
A.サラクディノフ、R。ゼメル、R。およびベンジオ、Y。 2015年。
見せて、出席して、教えてください:ニューラル画像のキャプションの生成
視覚的注意。機械に関する国際会議で
学習、2048〜2057。
[Y ang and Sun 2018] Y ang、D。、およびSun、J.2018。近位
dehaze-net:シングル用の以前の学習ベースのディープネットワーク
画像の曇り除去。欧州会議の議事録
コンピュータビジョン(ECCV)、702–717。
[Zhang and Patel 2018] Zhang、H。、およびPatel、V。 M.2018。
密に接続されたピラミッドの曇り除去ネットワーク。進行中-
コンピュータビジョンとパターンに関するIEEE会議の報告
認識、3194〜3203。
[Zhang etal。 2018]張、Y。 Li、K。Li、K。Wang、L。
Zhong、B。およびFu、Y。 2018.画像超解像us-
非常に深い残余チャネル注意ネットワークを作成します。プロで-
コンピュータビジョンに関する欧州会議の議事録
(ECCV)、286--301。
[Zhu、Mai、and Shao 2015] Zhu、Q。Mai、J。and Shao、L。
2015.を使用した高速単一画像ヘイズ除去アルゴリズム
前の色の減衰。画像プロに関するIEEEトランザクション
24(11):3522–3533を終了します。