RadarURL

웹 프로그래밍
2011.05.29 02:44

Webalizer 로그결과분석하기

조회 수 10272 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

Webalizer는 아파치 서버의 로그를 자세한 통계로 보여주는 서버관리자에게는 상당히 유용한

툴이다. 물론 Webalizer 말고 다른 로그분석툴이 많지만 일단 Webalizer가 가장많이 쓰이고

윈도우용으로 Cygwin으로 컴파일되어서 제공되기 때문에 설치도 비교적 간단한 편이다.

(설치방법은 http://xens.dnip.net/54 참고) 설치만 해놓고 그냥 보기만 해서는 잘이해가 되지

않을것이다. 그래서 내 블로그의 6월분 로그내용을 가지고 분석하는 방법을 알아보겠다.

사용자 삽입 이미지


웹얼라이저를 실행하면 다음과 같이 접속 통계를 일단 간단히 볼수 있다. 항목별로 자세히 보자.

사용자 삽입 이미지

Hits : 서버로부터 요구된 파일들의 합계이다. 클라이언트들이 만약 그림 3개를 요구했다면 해당
          웹페이지까지 합해 4개의 Hits가 올라간다. 07년 06월 Daily Avg의 Hits를 보면 6077인데 이는
          하루에 일평균 6076개의 이미지가 (한페이지라고만 가정했을때) 요구되었다고 보면 되겠다.
          한페이지에 있던 이미지라고 가정했을때 이미지 3개가 하루동안 대략 2000명의 사용자에게
          요구되었다고 해석하면 편하겠다.(블로그 특성상 여러페이지에서 클라이언트들의 요청이
          있기때문에 쉽게 이렇게 가정한것이다.)

KBytes : 클라이언트들에게 전송된 웹페이지 정보량의 합계이다. 6월 25일까지 1,977,062Kbytes가
              요청되었다.

Visits : 방문객들의 총합이다. 하루평균 331명이 들어온다고 나와있지만 검색엔진 로봇들도 포함
             되었기 때문에 실제 방문객 수는 이것보다 적을것이다.

Pages : 방문객이 실제로 서버에 접속한 웹페이지의 합계이다. 만약 어떤 방문객이 내 블로그를
              방문해서 각각 3개의 이미지가 있는 5개의 페이지를 봤다면 Hits는 (방문객1+이미지수3)*
              웹페이지수5 로 계산이 되어 20이올라가게 된다. 그리고 방문객 1명이 와서 열람했으므로
              당연히 visits는 1이 올라가고 Page를 5개를 봤으므로 Pages는 5개가 올라간다.

여기까지는 대략적으로 알아본것이고 이제 6월분의 자세한 웹로그 통계를 살펴보겠다.

사용자 삽입 이미지

월별 통계와 응답 코드에 대한 히트수를 전체적으로 볼수 있다. 앞서 Hits나 Pages,visits 등이

어떻게 증가되는지 알아봤기 때문에 전체적인 내용을 판단하기에 쉬울것이다. 응답코드에 대한

히트수를 보면 대략 클라이언트들이 어느종류의 요청을 했는지 알수있다. 예를들어 이그림에서

404에러같은 경우 265 Hits가 발생했는데 총 265번의 없는페이지를 사용자가 접속하려 했다고

해석할수 있겠다. 이그림에서 보이는 히트수들은 내가 저질러 놓은것들이 상당히 많아서 별로

신뢰성이 없다.

사용자 삽입 이미지


일별통계를 그래프와 함께 볼수 있다. 아래는 짤려있지만 6월 25일까지 집계되있고 그래프를 보면

일별로 어느날이 접속자수가 많은지 쉽게 알수있고 어느날에 Hits나 다운로드량이 많았는지도 알수

있다. 여기서는 6월 9일에 접속자가 가장 많았고 페이지 검색은 6일에 가장 많은것을 볼수있다. 다운

로드량은 24일에 가장 많은것을 볼 수 있다. 그래프 아래에서는 일별로 자세한 데이터가 집계되어

있는것을 볼수있다.

사용자 삽입 이미지


시간별로 어느시간대에 접속이 가장많은지 적은지 쉽게 알아볼수 있는 통계도 있다. 여기서 보면

23~24시에 Hits수가 가장 많고 아침 7시에 가장 적은것을 볼 수 있다. Kbytes 통계로 어느시간대에

다운로드량이 가장 많은지도 알수있다.

사용자 삽입 이미지

Hits수를 기준으로 방문객이 본 내 서버의 페이지중에 가장 방문이 많은 상위 30개의 파일을 보여

주고 있다. 이는 어떤 페이지를 가장 많이 보았는지를 의미하는데 어느블로그던 개인홈페이지던

비슷하겠지만 root 디렉토리가 0순위이다. 이를 통해 블로그에서나 어떤 홈페이지에서 어떤 페이

지가 방문자들이 읽는 횟수가 많은지 판단해서 그와 관련된 내용을 더 많이 올려 방문자수를 높히는

전략(?)을 세울수도 있겠다.

사용자 삽입 이미지


Top 10 of ?? Total URLs by Kbytes : 데이터 전송량을 기준, 방문객들이 본 웹페이지중 가장
방문이 많은 상위 10개의 파일들을 보여준다. 여기서 보면 물론 root가 가장 많다. 그외 root를 읽어
들일때 따라서 읽히는 파일들 또한 전송량이 많다. 그외에는 그다지 전송량이 크지 않은것을 볼 수
있다.

Top 10 of ?? Total Entry Pages : 방문자가 처음으로 접속한 페이지의 랭킹을 상위 10위권으로 표시해준다. 여기서 보면 물론 root가 가장 많을것이고 다음은 rss피드 페이지가 많다. 물론 이것
으로도 어떤 페이지를 방문객들이 와서 많이 읽는지 대략 알 수 있다.

Top 10 of ?? Total Exit Pages : 방 문자가 마지막으로 보고 나간 페이지의 상위 10위권 통계이다. 이것으로 어느 페이지가 방문객들에게 가장 인기가 없었는지 대략 알 수 있다. 하지만 이것만으로 섣불리 판단하기엔 부족하다. 필요한 정보만 다른 검색엔진에서 찾아서 보고 나갈수도 있기때문이다. 여기서 보면 root의 경우 Entry pages와 Exit pages가 동일한데 블로그 표시설정시 내가 한
페이지씩만 보여주도록 설정해놨기 때문인지 직접 내블로그 주소로 들어왔을때 방문객들이 다른 글을 읽는일이 아주 많지는 않다는것을 알수있다.

사용자 삽입 이미지


Hits수를 기준으로 어느곳에서 접속이 많이 이뤄졌는지 상위 30위권으로 표시된다. IP로 표시가

되는데 저두개의 IP는 구글 로봇이다. 첫번째는 내가 접속한 것인데 아무래도 글올리고 하다보면

내가 가장 접속이 많은건 당연하지 않을까 싶다. 구글 로봇이 얼마나 많이 접속하는지는 위에서

보면 알수있다. 내가 258번 접속하는데 구글 로봇이 두개만 합쳐도 198번이나 된다. 이것이 내가

호스팅 업체를 쓰지 않고 직접 서버를 돌려 블로그를 운영하는 이유중에 하나이다. 물론 검색엔진

에 자신의 블로그가 노출되는것은 좋은일이지만 다른파일도 봇들이 무차별로 순식간에 긁어가면서

트래픽을 크게 유발시키는 경우가 많다. robots.txt 파일에서 검색엔진 봇들이 한시간에 한번만

접속하게 해뒀는데도 많은 접속률을 보이고 있다.

사용자 삽입 이미지


전송량에 따른 상위 10위권의 순위를 보여준다. 이것도 IP로 표시되며 위에서 몇개의 IP들은 삭제해

놨지만 위의 두개의 봇들은 구글로봇들이다. 나머지 몇개의 IP들도 봇들이고 전송량이 꽤 된다.

그 아래는 Usernames에 따른 전송량,Hit수,방문수등을 보여준다. 그아래는 국가별 접속한 통계를

보여주는데 설정해놓은것이 없어서 한가지만 100%로 나온다. 윈도우용 Webalizer를 기본적으로

별다른 설정없이 설치했을때는 여기까지의 내용을 기본적으로 알아볼수가 있다. 물론 조작을

거쳐 레퍼러순위통계를 볼수도 있고 검색어 통계를 볼수도 있고 에이전트별(브라우저나 OS종류)

통계를 볼수도 있고 국가별 접속 통계를 볼수도 있다.

 

출처 : http://bearpro.tistory.com/18

?

공부 게시판

공부에 도움되는 글을 올려주세요.

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 [공지] 공부 게시판 입니다. 처누 2003.08.18 927881
666 네트워크 Delay Variation과 Jitter의 차이 JaeSoo 2011.06.11 12107
665 건강 소금은 생명이다. file JaeSoo 2011.06.10 13995
664 데이터베이스 MySQL Dump뜨는 방법 및 복구 방법 JaeSoo 2011.06.08 11123
663 유닉스/리눅스 페도라12 yum(rpm)으로 APM 설치 (수호신패치 포함) file JaeSoo 2011.06.08 12899
662 웹 프로그래밍 아파치 프로세스의 메모리 사용량 줄이기 JaeSoo 2011.06.01 11695
661 하드웨어 2세대 인텔 코어 i5-2500 시리즈 JaeSoo 2011.06.01 11488
660 소프트웨어 옆으로 누운 동영상 90도 회전 변환 (바닥인코더) file JaeSoo 2011.05.31 14674
659 기타 서울/경기 시외고속버스터미널 주소 및 연락처 홈페이지 file JaeSoo 2011.05.31 12808
» 웹 프로그래밍 Webalizer 로그결과분석하기 JaeSoo 2011.05.29 10272
657 윈도우즈 윈도우XP에서 텔넷 서버 (Telnet Server) 설정하기 JaeSoo 2011.05.26 11468
656 경제 그림으로 자세히 배우는 실업급여조건 및 신청 방법 1 file JaeSoo 2011.05.25 21253
655 웹 프로그래밍 제로보드를 설치하기 위한 서버 환경 비교. JaeSoo 2011.05.21 11031
654 웹 프로그래밍 APMSETUP 7 + eAccelerator 설치.. file JaeSoo 2011.05.21 14475
653 윈도우즈 네이버 블로그 마우스 제한 업그레이드 푸는방법 file JaeSoo 2011.05.18 10757
652 하드웨어 RAID 레벨에 따른 종합 정리표 file JaeSoo 2011.05.16 12111
651 건강 분유 먹인 아기, 행동 장애 2.5배 file JaeSoo 2011.05.16 9517
650 기타 전개도, 입체도형을 평면 위에 펴 놓은 그림 file JaeSoo 2011.05.12 9737
649 윈도우즈 Windows XP sp2에서 "게시자를 확인할 수 없어서 이 소프트웨어를 Windows에서 차단했습니다" 란 메세지와 함께 activex가 설치가 안될때 조치사항 JaeSoo 2011.05.12 11342
648 윈도우즈 MSVCP71.DLL 혹은 MSVCR71.DLL 을 찾을 수 없으므로 관련 오류.. file JaeSoo 2011.05.09 13676
647 건강 남자아이 VS 여자아이 태아발달 file JaeSoo 2011.04.30 15015
Board Pagination Prev 1 ... 86 87 88 89 90 91 92 93 94 95 ... 124 Next
/ 124


즐겨찾기 (가족)

JAESOO's HOMEPAGE


YOUNGAE's HOMEPAGE


장여은 홈페이지


장여희 홈페이지


장여원 홈페이지


즐겨찾기 (업무)

알리카페 홀릭

숭실대 컴퓨터 통신연구실 (서창진)

말레이시아 KL Sentral 한국인 GuestHouse


즐겨찾기 (취미)

어드민아이디

유에코 사랑회

아스가르드 좋은사람/나쁜사람

JServer.kr

제이서버 메타블로그

재수 티스토리


즐겨찾기 (강의, 커뮤니티)

재수 강의 홈페이지


한소리


VTMODE.COM


숭실대 인공지능학과


숭실대 통신연구실


베너