구분 | 컨설팅 | ||
---|---|---|---|
제목 | 데이터셋 구축 관련 문의 | ||
공개여부 | 공개 | ||
문의자 | 조윤정 | 문의일 | 2023-10-24 |
질문내용 | 인공지능 처리를 위해 데이터를 수집중에 있습니다. 그러나 데이터셋 구축을 위해 어떤 것이 좋은 데이터인지 어떤 것이 나쁜 것인지 판단이 쉽지가 않습니다. 조언 부탁드립니다. |
답변일자 | 2023-10-24 | ||
---|---|---|---|
답변내용 | 안녕하세요. 현재 수집하는 데이터가 어떤 것인지는 알 수 없지만 데이터에 대해서 어떤 것이 양질이다 아니다에 대한 정의는 명확하지가 않습니다. 다만, 분석하실 때 결과를 명확하게 받아들일 수 있는가 라고 생각하시면 어느 정도 이해가 되실 거라 판단됩니다. 즉, 분석하기 쉬운 데이터, 분석 결과물에 대해 정확한 판단을 내릴 수 있는 데이터, 결과에 대해서 누구나 수용할 수 있는 데이터라는 공통적인 특징이 있습니다. 또한, 데이터양이 많고 데이터 자체의 오류가 적으며 활용 목적과 형식이 적합하다면 데이터의 질이 좋은 편이라 할 수 있을 것 같습니다. | ||
첨부파일 |