데이터 카탈로그 description 개선방향 #5
Labels
datahub
The integration point that retrieves metadata from DataHub to provide better context for query gener
enhancement
New feature or request
Why
현재 상황:
문제점:
사용자 질문에 따라 참조할 수 있는 정보가 빈약해서 질문에 대한 올바른 테이블 데이터를 가져오지 않는 문제점이 있습니다.
현재 가져오는 데이터들은 테이블간의 관계(1:1, 1:N, M:N)가 포함되어 있지 않습니다.
예시:
How
DataHub의 데이터 카탈로그로부터 비즈니스 용어 사전, 테이블 메타 데이터를 생성해 사용자 질문의 맥락에 적합한 정보를 참조할 수 있게 할 수 있습니다.
계층적 구조를 갖는 상위 노드들을 만들어 관계를 명시적으로 표현하고, 이를 통해 테이블 간 JOIN에 사용할 수 있습니다.
프로젝트에 적용한다면 table, column description을 가장 하위 노드로 두고, Table의 관계, pk, fk 정보를 함께 포함시켜 상위 노드로 추가할 수 있습니다. 상위 노드에서 pk, fk 관계를 활용해 테이블을 JOIN 하는 효율적인 쿼리를 작성할 수 있습니다. 이런 계층적 구조를 사용하여 다양한 수준에서의 정보를 얻고, 활용할 수 있습니다.
Table, column description이 충분한 Kaggle 데이터셋을 포함시켜 사용할 수 있습니다.
What
The text was updated successfully, but these errors were encountered: