AI가 뭐든 분석해준다고 한다. 그런데 막상 “그래서 어떤 데이터를 넣어야 하죠?”라는 질문 앞에서 멈추는 경우가 많다. 데이터 설계 없이는 AI도 답을 내놓지 못한다.
이 글에서는 데이터를 분석하는 기술이 아니라, 분석할 데이터를 제대로 만드는 능력 — 즉 데이터 설계가 왜 AI 시대에 더 중요해졌는지를 3가지 이유로 풀어낸다. H/W Eng’r라면 이미 절반은 갖추고 있는 역량이다.
AI가 분석해준다는데, 왜 결과가 엉터리일까
F1 레이스에서 이런 상황을 상상해보자.
피트월의 엔지니어가 AI 분석 툴을 열었다. 한 달치 레이싱 데이터를 넣었더니 “날짜가 지날수록 타이어 마모가 빨라진다”는 결론이 나왔다. 날짜가 원인이라는 건데, 실제로는 여름이 깊어지면서 기온이 올라간 것이 진짜 원인이었다. AI는 틀린 변수를 학습한 것이다.
AI 분석이 틀린 게 아니다. 데이터 설계가 잘못된 것이다.
데이터 분석 기술은 빠르게 보편화되고 있다. 하지만 분석할 데이터를 올바르게 설계하는 능력은 여전히 현장 경험에서 나온다. 데이터 설계의 출발점은 도메인 지식이고, 그 중요성은 AI 시대에 오히려 더 커졌다.
이유 1 — 모든 AI 분석의 시작은 RAW DATA, 데이터 설계가 질을 결정한다
H/W 영역의 데이터는 어디서 오는가
소프트웨어 영역의 데이터는 클릭, 로그, 트랜잭션에서 온다. H/W 영역은 다르다. 온도, 압력, 속도, 가속도, 전압, 전류 — 물리 에너지를 센서로 잡아내는 것이 출발점이다.
H/W Eng’r는 오래전부터 이 일을 해왔다. 물리 법칙을 기술에 접목해 문제를 해결하는 것이 엔지니어링의 본질이다. AI는 이 과정에서 분석 속도와 처리 용량을 극적으로 높여준 도구다. 하지만 도구 이전에 재료가 있어야 한다.
나쁜 데이터로는 좋은 분석이 나오지 않는다. 이것은 AI 시대에도 변하지 않는 원칙이다. 오히려 AI가 대용량 데이터를 빠르게 처리할 수 있게 된 지금, 어떤 데이터를 어떻게 수집하느냐 — 즉 데이터 설계의 중요성은 더 커졌다.
| 데이터 품질 | AI 분석 결과 |
|---|---|
| 측정 지점이 잘못 설계됨 | 핵심 패턴이 데이터에 담기지 않음 |
| 변수 선택이 잘못됨 | 틀린 원인을 학습한 모델 생성 |
| 수집 조건이 일정하지 않음 | 노이즈가 신호로 오인됨 |
| 올바른 데이터 설계 | AI가 실전에서 쓸 수 있는 인사이트 생성 |
이유 2 — 측정 지점과 변수 선택, 데이터 설계 없이는 불가능하다
가설이 먼저, 센서가 나중이다
타이어 안쪽 편마모가 심하다는 경험적 의심이 있다고 해보자. 이를 데이터로 체계화하기 위해 타이어 두께 센서를 최외곽, 중간, 최내곽 세 지점에 부착하고 레이싱 중 데이터를 실시간 수집했다.
F1 레이싱 Engineering 사례는 설명을 위해 구성한 가상의 시나리오다.
실제 특정 팀이나 드라이버의 데이터를 기반으로 한 것이 아님을 밝혀 둔다.
분석 결과, 코너링 구간에서 안쪽 타이어의 마모가 집중적으로 발생한다는 패턴이 명확하게 드러났다. 여기서 도메인 지식이 있는 엔지니어와 없는 엔지니어의 분기점이 생긴다.
데이터만 보는 사람은 “코너링 시 내측 마모가 크다”는 사실을 확인하는 데 그친다. 하지만 타이어와 서스펜션의 물리적 관계, 캠버 각도, 코너링 하중 이동을 아는 엔지니어는 이 데이터에서 전략을 뽑아낸다.
- 코너링이 많은 트랙 → 타이어 교체 타이밍을 앞당기거나 내측 마모에 강한 타입 선택
- 직진 비중이 높은 트랙 → 교체 타이밍을 늦추고 연료 절약 전략에 집중
- 나아가 서스펜션 세팅 자체를 트랙 특성에 맞게 조정하는 방향까지
이 전략의 출발점은 “편마모가 코너링에서 심하다”는 경험적 가설이 있었기 때문에, 센서를 세 지점에 달겠다는 데이터 설계가 나온 것이다. 가설이 없었다면 타이어 두께 하나만 측정했을 것이고, 위치별 마모 차이라는 핵심 패턴은 데이터 안에 묻혀버렸을 것이다.
도메인 지식은 어디를 봐야 하는지를 먼저 알고 있다. 데이터 설계는 그 지식에서 출발한다.
이유 3 — AI는 분석 규모를 키웠지만, 해석의 책임은 엔지니어에게 있다
AI가 바꾼 것과 바꾸지 못한 것
AI 이전에는 RAW DATA가 있어도 분석할 수 있는 양이 한정적이었다. 사람이 직접 처리해야 했기 때문이다. 지금은 다르다. 수십만 건의 센서 로그도 전수 분석이 가능하고, 다중 지점 센서 데이터의 시계열 비교도 실시간으로 처리된다.
하지만 AI가 바꾸지 못한 것이 있다.
어떤 물리량을 측정할지 데이터 설계를 하고, 이상한 결과가 나왔을 때 그 원인을 물리적으로 해석하고, 분석 결과를 실전 전략으로 변환하는 일 — 이것은 여전히 도메인 지식 없이는 불가능하다.
| 구분 | AI가 바꾼 것 | AI가 바꾸지 못한 것 |
|---|---|---|
| 데이터 처리 | 대용량 전수 분석 가능 | 무엇을 측정할지 결정 |
| 패턴 탐지 | 복잡한 상관관계 자동 탐색 | 물리적 원인 해석 |
| 결과 활용 | 빠른 시각화·리포팅 | 전략으로 연결하는 판단 |
AI는 데이터를 처리한다. 엔지니어는 처리할 가치가 있는 데이터를 설계하고, 결과를 해석하고, 행동으로 연결한다.
핵심 요약
데이터 설계는 AI 시대에 더 중요해진 역량이다. AI가 대체하는 것은 반복적인 데이터 처리 작업이고, 대체하지 못하는 것은 무엇을 측정할지 아는 능력이다. 도메인 지식 위에 AI를 올리는 것 — 그것이 H/W Eng’r가 데이터 사이언스를 배워야 하는 진짜 이유다. “AI를 배워야 하나”가 아니라 “내 도메인 지식을 AI로 어떻게 확장할 것인가”라는 질문으로 시작해보자.
[링크 제안]
도메인 지식이 왜 중요한지 납득했다면, 다음 질문은 “그래서 어디서부터 시작하나”다. H/W Eng’r가 데이터 사이언스를 시작한 출발점이 궁금하다면 이 글을 이어 읽어보자.
데이터를 올바르게 해석하려면 인과관계와 상관관계를 구별하는 눈이 먼저 필요하다.
영화 F1을 감상하며 Refresh도 하고 Inspiration도 얻어보자







