ハイブで解析するjson文字列のget_json_objectとjson_tuple



Get_json_object Json_tuple Json String Parsing Hive



テクノロジーがアプリを埋め込むと、複数のフィールドが配列に格納されていると表示されるため、モデルがデータを呼び出すときに、さらにクリーンアップするために埋め込みデータを解析する必要があります。この記事では、json文字列を解析するためのget_json_objectとjson_tupleの2つの関数を紹介します。

テーブルの構造は次のとおりです。




1つ、get_json_object



関数の関数:json文字列のフィールドを解析するために使用されます:

select get_json_object(flist,'$.filtertype') as filtertype ,get_json_object(flist,'$.filtersubtype')as filtersubtype ,get_json_object(flist,'$.filtername') as filtername from aaaaaaa結果は次のとおりです(1つのデータのみが解析されます)。


2、json_tuple



関数の関数:json文字列の複数のフィールドを解析するために使用されます

select a.flist ,b.filtertype ,b.filtersubtype ,b.filtername from aaaaaaaaa a lateral view json_tuple(flist,'filtertype', 'filtersubtype', 'filtername') b as filtertype, filtersubtype,filtername

結果は次のとおりです。


get_json_objectとjson_tupleは、埋め込みポイントデータを解析するときによく使用され、より効果的でシンプルです〜