ハイブで解析するjson文字列のget_json_objectとjson_tuple
Get_json_object Json_tuple Json String Parsing Hive
テクノロジーがアプリを埋め込むと、複数のフィールドが配列に格納されていると表示されるため、モデルがデータを呼び出すときに、さらにクリーンアップするために埋め込みデータを解析する必要があります。この記事では、json文字列を解析するためのget_json_objectとjson_tupleの2つの関数を紹介します。
テーブルの構造は次のとおりです。
1つ、get_json_object
関数の関数:json文字列のフィールドを解析するために使用されます:
select get_json_object(flist,'$.filtertype') as filtertype ,get_json_object(flist,'$.filtersubtype')as filtersubtype ,get_json_object(flist,'$.filtername') as filtername from aaaaaaa
結果は次のとおりです(1つのデータのみが解析されます)。
2、json_tuple
関数の関数:json文字列の複数のフィールドを解析するために使用されます
select a.flist ,b.filtertype ,b.filtersubtype ,b.filtername from aaaaaaaaa a lateral view json_tuple(flist,'filtertype', 'filtersubtype', 'filtername') b as
filtertype, filtersubtype,filtername
結果は次のとおりです。
get_json_objectとjson_tupleは、埋め込みポイントデータを解析するときによく使用され、より効果的でシンプルです〜