hive 自定义函数

hive自定义函数

若如初见. 提交于 2019-12-02 16:22:43
自定义函数包括三种UDF、UDAF、UDTF UDF(User-Defined-Function) 一进一出 UDAF(User- Defined Aggregation Funcation) 聚集函数,多进一出。Count/max/min UDTF(User-Defined Table-Generating Functions) 一进多出,如lateral view explore() 使用方式 :在HIVE会话中add 自定义函数的jar文件,然后创建function继而使用函数 UDF 这是普通的用户自定义函数。接受单行输入,并产生单行输出。 1、UDF函数可以直接应用于select语句,对查询结构做格式化处理后,再输出内容。 2、编写UDF函数的时候需要注意一下几点: a)自定义UDF需要继承org.apache.hadoop.hive.ql.UDF。 b)需要实现evaluate函数,evaluate函数支持重载。 注:UDF只能实现一进一出的操作,如果需要实现多进一出,则需要实现UDAF udf实现对字符串的截取 package hive; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.hadoop.hive.ql.exec.UDF; public