嗨,我尝试创建一个表用一个简单的查询如下:
select distinct
b.week_start_date,
count(distinct visitor_id) as uu,
count(distinct visit_id) as session,
sum(1) FILTER (WHERE event_name = 'pageview') AS pageview
from
table a
join
table b on a.date = b.cy_date_num_yyyymmdd
where
a.date between '20211107' and '20211113'
group by
1
然而,我得到一个错误
GENERIC_INTERNAL_ERROR:结束索引(-2147483642)必须不负
我需要手动干净的数据的地点指定清单。 雅典娜不会删除的数据,在你的帐户。
所以我试图创造一个超级空白表格(查询以下)的定义的格式对于每个指标,然后插入以上查询到这个超级表。 但它仍然返回的相同的错误。 有人可以帮我解决这个问题?
CREATE EXTERNAL TABLE IF NOT EXISTS database.super_table
(
week_start_date date,
uu bigint,
session bigint,
pageview bigint
)ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION
's3://abc-dataeng-temp-prod/xyz/product/'
TBLPROPERTIES (
'has_encrypted_data'='false',
'parquet.compression'='GZIP');