오픈콜

디지털오픈랩에 대해 궁금한 점을 올려주시면 신속히 답변드립니다.
구분 컨설팅
제목 데이터셋 구축 관련 문의
공개여부 공개
문의자 조윤정 문의일 2023-10-24
질문내용 인공지능 처리를 위해 데이터를 수집중에 있습니다. 그러나 데이터셋 구축을 위해 어떤 것이 좋은 데이터인지 어떤 것이 나쁜 것인지 판단이 쉽지가 않습니다. 조언 부탁드립니다.
답변일자 2023-10-24
답변내용 안녕하세요. 현재 수집하는 데이터가 어떤 것인지는 알 수 없지만 데이터에 대해서 어떤 것이 양질이다 아니다에 대한 정의는 명확하지가 않습니다. 다만, 분석하실 때 결과를 명확하게 받아들일 수 있는가 라고 생각하시면 어느 정도 이해가 되실 거라 판단됩니다. 즉, 분석하기 쉬운 데이터, 분석 결과물에 대해 정확한 판단을 내릴 수 있는 데이터, 결과에 대해서 누구나 수용할 수 있는 데이터라는 공통적인 특징이 있습니다. 또한, 데이터양이 많고 데이터 자체의 오류가 적으며 활용 목적과 형식이 적합하다면 데이터의 질이 좋은 편이라 할 수 있을 것 같습니다.
첨부파일