Rabu, 25 Mei 2011

BAB 4. Analisis WEB

Analisis Web adalah pengukuran, pengumpulan, analisis dan pelaporan data internet untuk tujuan memahami dan mengoptimalkan penggunaan web. Web analytics bukan hanya alat untuk mengukur lalu lintas situs Web tetapi dapat digunakan sebagai alat untuk penelitian bisnis dan riset pasar. Web analytics aplikasi juga dapat membantu perusahaan mengukur hasil kampanye iklan cetak tradisional. Ini membantu seseorang untuk memperkirakan bagaimana lalu lintas ke situs web berubah setelah peluncuran kampanye iklan baru. analisis Web menyediakan data tentang jumlah pengunjung, tampilan halaman, dll untuk mengukur lalu lintas dan tren popularitas yang membantu melakukan riset pasar.
Ada dua kategori analisis web luar lokasi dan di situs web analisis.
Secara historis, analisis web telah disebut pengukuran pengunjung di tempat. Namun dalam beberapa tahun terakhir ini telah kabur, terutama karena vendor yang memproduksi peralatan yang menjangkau kedua kategori.
Situs web analisis ON teknologi
Banyak vendor yang berbeda memberikan-situs web pada analisis perangkat lunak dan jasa. Ada dua pendekatan teknologi utama untuk mengumpulkan data. Metode pertama yaitu analisis logfile, membaca file log di mana web server mencatat semua transaksi perusahaan. Metode kedua yaitu tag halaman, menggunakan JAvaScript pada setiap halaman untuk memberitahu sebuah server pihak ketiga saat halaman diberikan oleh web browser . Keduanya mengumpulkan data yang dapat diolah untuk menghasilkan laporan web lalu lintas.
Selain itu sumber data lain juga dapat ditambahkan untuk menambah data. Misalnya; mail tingkat respon-e, data kampanye direct mail, penjualan dan informasi memimpin, kinerja data pengguna seperti klik pemetaan panas , atau metrik kustom lain yang diperlukan.
Web server merekam beberapa transaksi mereka di sebuah file log. Hal ini segera menyadari bahwa file log dapat dibaca oleh program untuk menyediakan data tentang popularitas website. Maka muncullah analisis perangkat lunak web .
Pada awal 1990-an, web statistik situs terutama terdiri dari menghitung jumlah permintaan klien (atau hit) dibuat untuk web server. Ini adalah metode yang masuk akal pada awalnya, karena setiap situs web sering terdiri dari sebuah file HTML tunggal. Namun, dengan pengenalan gambar dalam HTML, dan situs web yang membentang beberapa file HTML, jumlah ini menjadi kurang bermanfaat.Yang pertama benar komersial Log Analyzer dirilis oleh IPRO pada tahun 1994 .
Dua unit ukuran diperkenalkan pada pertengahan tahun 1990 untuk mengukur secara lebih akurat jumlah aktivitas manusia pada server web. Ini adalah tampilan halaman dan kunjungan (atau sesi). Sebuahtampilan halaman didefinisikan sebagai permintaan dibuat untuk server web untuk halaman, sebagai lawan dari grafis, sementara mengunjungididefinisikan sebagai urutan permintaan dari klien diidentifikasi unik yang berakhir setelah jumlah tertentu tidak aktif, biasanya 30 menit . Halaman tampilan dan kunjungan masih sering ditampilkan metrik, namun kini dianggap lebih sederhana.
Munculnya search engine spide dan robot pada akhir tahun 1990an, bersama dengan proxy web dan alamat IP yang ditetapkan secara dinamis untuk perusahaan besar dan ISP , membuatnya lebih sulit untuk mengidentifikasi pengunjung manusia unik ke situs web. Log analisis menanggapi dengan melacak kunjungan oleh cookie , dan dengan mengabaikan permintaan dari laba-laba dikenal.
Penggunaan ekstensif web cache juga disajikan masalah untuk analisis logfile. Jika seseorang mengunjungi kembali halaman, permintaan kedua akan sering diambil dari cache browser, sehingga permintaan tidak akan diterima oleh server web. Ini berarti bahwa jalan seseorang melalui situs hilang. Caching dapat dikalahkan dengan mengkonfigurasi server web, tetapi hal ini dapat mengakibatkan performa yang terdegradasi untuk pengunjung ke situs web.
Topologi WEB
Belajar sifat-sifat dari Web sebagai objek formal menyediakan cukup banyak pengaruh untuk desainer dari sistembaru, dan badan standar yang tugasnya adalah menemukan dan menjaga variasi dari pengalaman Web padaskala besar. Pada bagian ini kita akan meninjau secara singkat upaya untuk mendeskripsikan topologi web.
Topologi Web
* Struktur Web
Investigasi topologi dilakukan untuk memahami bentuk dasar dari arsitektur dan relasi diantara keduanya. Struktur dapat memberi kita banyak informasi. Penyelidikan struktur dari web selalu tergantung dari level pemisahan dari pendeskripsian struktur web. Seperti contohnya saja ukuran web yang mungkin memiliki perbedaan sangat kecil dalam kinerja dari komponennya mampu memberikan perbedaan besar di level makro.
Pemahaman struktur sangat penting untuk sejumlah aplikasi, seperti navigasi, pencarian, menyediakan sumber daya untuk mendukung komunitas online, atau efek dari perubahan mendadak dalam permintaan informasi.
Topologi Web berisi kompleksitas dari rantai linear sederhana. Pada bagian ini, kita akan membahas upaya untukmengukur struktur global dari Web, dan bagaimana halaman web individu dapat masuk ke dalam konteks itu
* Penelitian teoritis graph
Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah teori grafik. Web dapat dilihat sebagaigrafik yang besar pada tengah halaman dan bagian tepinya adalah link. Karena weblinks sangat sedikitberantakan, jelas bahwa tepi grafik mengkodekan banyak struktur yang terlihat oleh desainer dan penulis konten yang bagi mereka adalah sama pentingnya.
Konektivitas webgraph telah dianalisis secara rinci, menggunakan struktural seperti indikator seperti bagaimananode yang terhubung. Berbagai makro struktur scopic telah dilihat dan diukur, misalnya satu merangkak dari lebihdari 200 juta halaman menemukan bahwa 90% dari Web sebenarnya tersambung. Struktur berik
utnya seringdisebut sebagai bentuk bowtie, seperti yang ditunjukkan pada Gambar di bawah. Simpul dasi sangat berhubungancluster (SCC) dari webgraph di mana terdapat jalur antara setiap pasangan node. SCC ini diapit oleh dua setcluster, mereka yang dihubungkan (link) ke SCC tetapi dari yang tidak ada backlink (ditandai sebagai DI dalam gambar), dan mereka yang terkait dari SCC tetapi tidak link kembali (OUT). Hubungan antara SCC, IN dan OUTmemberikan bentuk bowtie. Implikasi dari penemuan ini masih topologi perlu dipahami. Meskipun beberapa telahmengusulkan perubahan terhadap algoritma PageRank untuk mengambil keuntungan dari topologi dasar, masih ada banyak pekerjaan yang harus dilakukan untuk mengeksploitasi struktur terlihat.

Struktur bowtie lazim di berbagai skala. Dill di al telah menemukan bahwa himpunan bagian yang lebih kecil dari Web juga memiliki bentuk bowtie, sebuah petunjuk bahwa Web mempunyai sifat fractal yang menarik karakteristiksebagai Web pada umumnya.
Memang, pertanyaan skala dipotong dua arah. Ada yang lain, lebih kecil dari Web sekitar, dan web itu sendiridatang sebagai sesuatu dari kejutan bagi matematikawan dan ilmuwan komputer pada saat itu dimulai, sekarangstudi Web cenderung melihat Web. Struktur tersebut sebagai Intranets mempunyai sifat yang sangat berbeda,dalam hal ukuran, konektivitas, koherensi dan pencarian sifat; beberapa sifat terbawa dari Internet secara keseluruhan, sementara yang lainnya tidak. Telah ada sedikit pekerjaan atas struktur kontras, meskipun melihat untuk investigasi Intranet, dan subgraphs sesuai dengan topik scientific tertentu . Web cukup jarang tersambung,berarti bahwa subgraph disebabkan oleh satu set acak node akan hampir kosong, tetapi jika kita mencarikelompok non-acak (cluster tematis-bersatu atau TUCs) yang jauh lebih dihubungkan, maka kita melihat bentukbowtie muncul lagi. Setiap TUC akan memiliki SCC sendiri, dan sendiri IN dan OUT sisi, termuat di dalam SCCyang lebih luas. SCC skala yang lebih besar, karena sangat berhubungan, kemudian dapat bertindak sebagaitulang punggung navigasi antara TUCs.
Matematika WEB
Opez L 'Ortiz, dalam surveinya, terlihat di sejumlah paradigma berguna untuk memahami dasar-dasar algoritmikInternet pada umumnya dan Web pada khususnya. Menerapkan wawasan tentang algoritma masalah jaringan,dalam konteks protokol tertentu mendasari Web, berpotensi sangat bermanfaat. Pertumbuhan dari Web, sepertiOpez L ‘Ortiz tunjukkan, adalah yang paling canggih dari teks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka dalam aplikasi standar pada awal tahun 1995, namun berjuang keras pada akhirtahun itu.

*Model rasional
Salah satu paradigma penting adalah bahwa dari ekonomi mikro, mathemat diskrit ics, teori pilihan rasional dan teori permainan. Meskipun pengguna individu mungkin atau mungkin tidak "rasional",itu telah lama mencatat bahwa secara masal orang berperilaku sebagai maximisers utilitas. Dalam hal ini,pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk model menghasilkanperilaku, dan karenanya pandangan tentang apa global set perilaku yang diinginkan bisa direkayasa, dan apa yangbisa system mendukung perilaku tersebut.



Jika, seperti dalam Gambar di atas, kurva penawaran adalah elastis sempurna (misalnya horizontal), ada tigakesetimbangan: dua titik di mana suplai persilangan kurva kurva permintaan (pada jaringan ukuran B dan C), dan titik di mana kurva penawaran hits sumbu y (A = 0). Jika jaringan ukuran tetap pada 0, maka permintaan tetap nihil,dan kami tinggal di posisi A. Pada C, posisi ini juga stabil; jaringan berisi semua customers siap untuk membayartarif pasar, dan tidak bisa tumbuh karena ada tidak ada orang lain siap untuk membayar. Jika jaringan tumbuh, itu harus karena harga telah jatuh (yaitu kurva penawaran telah bergerak ke bawah; jika menyusut jaringan, yang harus karena seseorang telah mengubah preferensi dan sekarang tidak lagi siap untuk membayar harga pasar(yaitu kurva permintaan telah bergerak ke bawah). Jika kita berasumsi bahwa dua kurva tetap diam, maka setiap perubahan akan mengakibatkan slip kembali ke C. Kuncinya adalah B, yang meskipun suatu kesetimbangan tidak stabil. Jika ukuran jaringan tergelincir di bawah B, maka tidak cukup banyak orang akan siap untuk membayartingkat pasar dan permintaan secara bertahap akan tergelincir kembali ke nol. Jika di sisi lain bisa mendapatkandari B, maka tiba-tiba banyak lebih banyak konsumen akan muncul yang siap untuk membayar harga pasar ataulebih, dan ukuran jaringan akan meningkat secara dramatis, mendapatkan lebih dari punuk kurva permintaan danmencapai C. Jadi B adalah massa kritis untuk jaringan.

* Model Pencarian Keterangan
Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah fokus untuk perlombaan senjataantara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar danlebih kompleks, dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu ataukompleksitas dari query).

Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak lingkungan di mana massa data ditambang untuknugget akal; masalah khas adalah kompleksitas dan kurangnya pola. Benchmark koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan hampir tidak pernah sengaja menyesatkan, seperti koleksi ilmiah makalah dalam jurnal khusus. Web-lain seperti mini-struktur yang dapat digunakan, seperti Intranet, juga ditandaidengan itikad baik dengan informasi yang disajikan. Namun upaya berbahaya untuk menumbangkan sangat IRsistem yang theWeb dukungan baik yang semakin umum. IR berbasis web harus menghadapi tidak hanya skaladan kompleksitas informasi, tetapi upaya potensi untuk condong hasilnya dengan konten dimaksudkan ntukmenyesatkan.

* Struktur Berbasis Pencarian
Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untukmembuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, danmereka yang tidak, hanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur linksubgraphs lokal. Juga tidak HITS algoritma juga tidak Kleinberg Page et al PageRank dibutuhkan dalam lainmasukan dari struktur dinyatakan uninterpreted dari hyperlink ke dan dari halaman Web.

Search engine juga harus berjuang untuk tetap saat ini, oleh Mengindeks ulang sesering mungkin, konsistendengan menekan biaya, sebagai Web tumbuh dan halaman individu diedit atau diubah sebagai database mendasari mereka mengubah. Search engine dapat dibandingkan dengan menggunakan berbagai parameter,baik itu liputan mereka (jumlah hits kembali query yang diberikan, terutama melihat jumlah hits hanya dicapai olehmesin pencari), relevansi dari halaman kembali; waktu diambil, atau kualitas kembali. Sebagai salah satuharapkan, mesin yang berbeda melakukannya dengan baik pada metrik yang berbeda.

* Metode Matematika untuk Menggambarkan Struktur
Memahami matematika dan topologi dari Web adalah praktis impor untuk memahami invariants dari pengalamanWeb dan Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting properti yangmemiliki Web adalah ketahanan dalam menghadapi pengaruh undermining; baik hacker maupun kesalahan yang tak terelakkan dalam fisik jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router dalamempat puluh turun di setiap saat satu. ASI Barab dan kolega advokasi.

Di sisi lain, teori perkolasi menunjukkan bahwa skala bebas karya agak lebih rentan terhadap terarah, seranganterkoordinasi, bahkan jika mereka tahan terhadap kegagalan acak. Non-acak kegagalan bisa merusak jika merekamenargetkan situs yang sangat terhubung, kegagalan sejumlah kecil hub secara dramatis dapat meningkatkan diameter Web (dalam hal jumlah terkecil klik diperlukan untuk pergi dari satu halaman yang dipilih secara acaklain), dan kegagalan dari sejumlah besar situs yang sangat-tersambung bisa menyebabkan fragmentasi.

* Metode Matematika untuk Menggambarkan Layanan
Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen dan layanan Webakan hidup online dan dipanggil oleh pengguna, dan di mana metafora yang semakin penting adalah bahwa klienmenghubungi penyedia layanan, representasi matematika baru, formalisms dan teori menjadi berguna untuk menggambarkan hubungan ini.

Ada kebutuhan untuk bahasa untuk menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa matematika yang tercantum di sini bisa mendukung bahasa tersebut. Ada hidup perdebatan tentang jala Petri danĪ€-kalkulus, berfokus pada manfaat relatif dari, jaring negara berbasis grafis, dan semakin tekstual, linier, aljabarevent.

Tidak ada komentar:

Posting Komentar