본문 바로가기

분류 전체보기243

[초보자 필독] 머신러닝 성능을 좌우하는 데이터 전처리 핵심 가이드 부제: 이상치, 결측치 처리부터 피처 스케일링, 그리고 가장 헷갈리는 인코딩(Label vs. One-Hot)까지 완벽 정리들어가며: "Garbage In, Garbage Out"머신러닝의 세계에는 유명한 격언이 있습니다. "Garbage In, Garbage Out." 즉, 쓰레기 같은 데이터를 넣으면 쓰레기 같은 결과가 나온다는 뜻입니다. 최고의 모델, 최첨단 알고리즘을 사용하더라도, 데이터가 제대로 준비되어 있지 않다면 모델의 성능을 결코 보장할 수 없습니다.많은 초보자분들이 모델을 선택하고 학습시키는 데 집중하지만, 실제 프로젝트 시간의 60~80%는 데이터를 정제하고 가공하는 '데이터 전처리' 과정에 소요됩니다. 이 과정이 바로 모델의 성능을 좌우하는 가장 중요한 단계입니다.이번 포스팅에서는 머.. 2025. 8. 5.
2025년 8월 미국 경제 및 증시 심층 분석: 금리 인하 기대감 속 경기 침체 경고등 서론: 기로에 선 시장 - 줄다리기를 해독하다최근 미국 금융 시장은 투자자들이 '채찍질당하는(whiplash)' 듯한 경험을 한 주였습니다. 7월 말과 8월 초, 시장은 충격적인 고용 보고서가 촉발한 급격한 매도세와 연방준비제도(Fed, 연준)의 임박한 금리 인하에 대한 시장의 낙관적인 베팅이 이끈 강력한 반등 사이를 오갔습니다. 이러한 극심한 변동성은 현재 시장이 처한 복잡한 현실을 극명하게 보여줍니다. 한쪽에서는 약화되는 거시 경제 펀더멘털이 경기 침체의 경고등을 켜고 있고, 다른 한쪽에서는 완화적 통화 정책에 대한 기대감이 주가를 밀어 올리는 팽팽한 '줄다리기'가 벌어지고 있습니다. 미국 경제는 중대한 변곡점에 서 있습니다. 주요 경제 지표들이 서로 엇갈린 신호를 보내면서 정책 입안자와 투자자.. 2025. 8. 5.
[모델 맞춤] 머신러닝 성능을 2배 올리는 피처 엔지니어링 전략 (전처리, 생성, XGBoost vs 선형 모델) "Garbage in, garbage out." (쓰레기를 넣으면 쓰레기가 나온다) 머신러닝에서 모델의 성능은 결국 데이터의 품질에 의해 결정됩니다. 아무리 뛰어난 모델을 사용하더라도, 데이터가 제대로 준비되지 않았다면 좋은 결과를 기대하기 어렵습니다.**피처 엔지니어링(Feature Engineering, 특성 공학)**은 원본 데이터(raw data)를 모델이 더 잘 이해하고 학습할 수 있는 형태로 가공하고 새로운 정보를 만들어내는, 머신러닝 프로젝트의 가장 핵심적인 과정입니다.이 글에서는 피처 엔지니어링의 두 기둥인 특성 전처리와 특성 생성부터, 모델 유형에 따라 전략을 어떻게 다르게 가져가야 하는지**까지 모든 것을 알아보겠습니다. 특성 전처리 (Feature Preprocessing)특성 생성 .. 2025. 8. 3.
[경기/동탄] 동탄 SIAM(시암)에 다녀왔어요 안녕하세요~오늘은 동탄호수공원 근처에 있는 타이 레스토랑 SIAM(시암)에 다녀왔습니다.아버지 생신이라 특별한 음식을 먹고 싶었는데 예전에 태국에가서 먹었던 음식이 생각나신다고 하셔서 동탄 호수공원 갔다가 여기에 오게 됐습니다!  주차는 근처에 그냥 하면 될 것 같더라구요~ 참고하세요  SIAM이란 1939년 이전에 가장 부강했던 태국 왕조명이라고 합니다 ㅋㅋ       1. 뿌(뿌님)팥 뽕가리 30,000원껍찔까지 부드러운 소프트 크랩을 겉은 바삭, 속은 촉촉하게 튀겨 달걀, 우유를 더한 커리에 볶아 부드러운 식감과 게살의 감칠맛이 폭발하는 한국인이 가장 사랑하는 태국요리 입니다!  3. 느아 팥 마크아야오 28,000원탱글한 가지의맛과 향에 소고기 안심의 육즙과 더해져 깔끔한 감칠맛과 매콤한 풍미가 .. 2024. 6. 6.
300x250