民工心事 发表于 2024-11-6 23:02:53

【蚂蚁SQL面试题】蚂蚁数据研发一面面试题

蚂蚁数据研发面试题:盘算贷款用户风险等级标题解析

一、标题背景

在数据处理惩罚中,我们有两张表,一张是用户贷款信息表dwd_trd_loan_tb_dd,包含uid(用户 id)、amt(贷款金额)、ovd_days(逾期天数)、dt(时间分区);另一张是逾期等级配置表dim_ovd_config_dd,包含ovd_days(逾期天数)、user_level(用户风险等级)。比方,当ovd_days = 1且user_level = 1,表现用户逾期天数 <= 1 时,用户风险等级都为 1;当ovd_days = 30且user_level = 2,表现用户逾期天数 > 1 同时 <= 30 时,用户风险等级为 2。标题是盘算 20241011 日所有贷款用户对应的风险等级。
二、测试数据预备

以下是创建表和插入测试数据的 SQL 代码:
create table dwd_trd_loan_tb_dd (
uid string,
amt int,
ovd_days int,
dt string
);
create table dim_ovd_config_dd (
ovd_days bigint,
user_level bigint
);
INSERT INTO dwd_trd_loan_tb_dd VALUES
('1001',1000,0,'20241011'),
('1002',1000,33,'20241011'),
('1003',1000,12,'20241011'),
('1004',1000,68,'20241011')
;
INSERT INTO dim_ovd_config_dd VALUES
(1,1),
(30,2),
(60,3),
(180,4);
三、思绪分析


[*]表关联标题
看到多张表,首先考虑举行 JOIN。但初看只能用逾期天数举行关联,却又无法直接关联,由于配置表数据量小,这里可以考虑笛卡尔积。
[*]数据处理惩罚标题
在笛卡尔积后,必要判断每个用户的逾期天数是否小于所有配置的逾期天数,假如是则保留。这样会出现一个用户对应多个等级的情况,此时我们要取对应配置逾期天数最小的那一条。办理方法是按照uid举行分组,对配置逾期天数取最小值即为所需。
四、解题步骤


[*]第一步:表关联
首先将两个表举行关联,使用以下 SQL 代码:
with t as (
    select l.*,l.ovd_days lovd_days,c.*,c.ovd_days covd_days from dwd_trd_loan_tb_dd l
      join dim_ovd_config_dd c
      on 1=1
)
select * from t ;

[*]第二步:盘算用户风险等级
在关联后的底子上,通过以下 SQL 代码盘算每个用户的最小风险等级:
with t as (
    select l.*,l.ovd_days lovd_days,c.*,c.ovd_days covd_days from dwd_trd_loan_tb_dd l
      join dim_ovd_config_dd c
      on 1=1
)
select uid,min(user_level) from t where lovd_days < covd_days group by uid;
通过以上步骤,我们可以盘算出 20241011 日所有贷款用户对应的风险等级。这种方法通过奇妙的表关联和数据处理惩罚逻辑,办理了看似复杂的多表数据盘算标题。希望这篇博客对各人明白此类数据处理惩罚标题有所帮助。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 【蚂蚁SQL面试题】蚂蚁数据研发一面面试题