Beykozlu
New member
Türkiye İstatistik Kurumu (TÜİK), internet üzerinden satışı her geçen gün artan birtakım mamüllerin fiyatını da enflasyon hesaplamasında dikkate alacak.
Ekotürk’ün TÜİK’ten edindiği bilgiye bakılırsa, TÜİK, beyaz eşya, elektronik eserler, mobilya, birinci el arabalar ve otobüs bileti fiyatları için 2022 yılı prestijiyle internet üzerinden derlenen meblağları endeks hesaplamalarında kullanacak.
İnternet meblağlarının TÜFE’ye entegre edilmesinin gerekli hale geldiği değerlendirilirken, bu biçimdece istatistik üretiminde data derleme sıklığının daha yüksek ve daha büyük hacimli olması hedefleniyor. Kelam konusu bilgilerin mevcut yapıyı geliştirmek ve yeni değişkenleri elde etmek için büyük bir fırsat sunduğu düşünülüyor.
Otomatik olarak bir web kaynağından data derlemeye data kazıma (web scraping) deniliyor. Bu çoklukla bir kazıyıcı (scraper) sayesinde oluyor ve daha gelişmiş istatistiksel tahliller için ham bilgiyi derleyip temizliyor.
Otomatik data kazıma teknolojilerini kullanarak günlük, saatlik ve hatta daha yüksek sıklıkta bilgi yapısıyla optimal bilgi derleme stratejileri elde edilebiliyor. bu biçimdece, ayrıntılı metaveri ayrıntıları derlenerek hesaplamalar geliştirilebiliyor. Bu usulde genel hedef, web sitesinde yer alan HTML formatındaki bilgiyi tahlil ve hesaplamalar için daha uygun yapılara dönüştürmek.
Kriterlere nazaran web sitesi seçiliyor
Bu yolda, uygun web sitesi seçimi için kimi kriterler de aranıyor. Bunun için sitenin temsiliyet, hacim, içerik kaynağı, sürdürülebilirliği, teknik özellikleri, metaveri ve amaç değişkenleri üzere ögelere bakılıyor.
TÜİK, internetten data kazıma çalışmaları kapsamında 2020 yılında TÜBİTAK ile ortaklaşa TÜİK Büyük Data İleri Analitik Projesi’ni gerçekleştirdi. Bilgi kaynakları olan firmalardan gerekli müsaadeler alınarak, internetten data kazıma fiyat derleme yolunun altyapısı hazırlandı.
Proje kararı gelen ham bilgi, TÜİK teknik işçisi tarafınca tahlil edildi, yanılgılar belirlendi ve fiyat derlenebilecek hale getirildi. sonrasındasında bilginin tablo formatında, fiyat takibi yapılabilir ve data tahliline uygun olması sağlandı.
Eserlerin fiyatı yıl boyunca takip edilecek
Beyaz eşya, elektronik eserler, mobilya, birinci el arabalar ve otobüs bileti meblağları için 2022 yılı prestijiyle internet üzerinden derlenen fiyatlar endeks hesaplamalarında kullanılacak. Aralık ayı temel alınarak takibi kararlaştırılan mamüllerin fiyatı, eser kodu ya da eser barkodu üzerinden yıl boyunca takip edilecek. bu biçimdece birebir kalitedeki mamüllerin fiyat gelişimleri endeks hesaplamalarına yansıtılacak. Bu kapsamdaki fiyatların sayısı aylık yaklaşık 20 bin civarında.
Bilgi kazıma yoluyla elde edilen bilgiler günlük olarak takip edilerek fiyat değişim tahlilleri de yapılıyor. Ayrıyeten fiyatı gelen mamüllerin satışının devamlılığı da fiyat derleme devri ortasındaki fiyat sayıları denetim edilerek gözleniyor.
İnternet verisinin kullanması yaygınlaştırılacak
Gelecek periyotta yeni sisteme adapte edilen eser fiyatlarının günlük olarak data akışı sağlanacak, tahlilleri yapılacak ve öbür bilgi derleme halleri olan barkod ve alan verisiyle birlikte fiyat derleme devrinin sonunda endeks hesaplamalarında kullanılacak. TÜFE kapsamında derlenen aylık fiyatların yaklaşık olarak yüzde 40-45’i barkod ve internetten data kazımayla elde edilmiş olacak ve bu biçimdece bilgi, kaynağında mümkün olan en hakikat haliyle derlenecek.
TÜİK, bu kapsamda en az maliyetle en hakikat bilgiyi elde edebilecek. Bu amaç doğrultusunda öteki ülke çalışmaları da dikkate alınarak barkod ve internet datalarının kullanmasının yaygınlaştırılması öngörülüyor.
Ekotürk’ün TÜİK’ten edindiği bilgiye bakılırsa, TÜİK, beyaz eşya, elektronik eserler, mobilya, birinci el arabalar ve otobüs bileti fiyatları için 2022 yılı prestijiyle internet üzerinden derlenen meblağları endeks hesaplamalarında kullanacak.
İnternet meblağlarının TÜFE’ye entegre edilmesinin gerekli hale geldiği değerlendirilirken, bu biçimdece istatistik üretiminde data derleme sıklığının daha yüksek ve daha büyük hacimli olması hedefleniyor. Kelam konusu bilgilerin mevcut yapıyı geliştirmek ve yeni değişkenleri elde etmek için büyük bir fırsat sunduğu düşünülüyor.
Otomatik olarak bir web kaynağından data derlemeye data kazıma (web scraping) deniliyor. Bu çoklukla bir kazıyıcı (scraper) sayesinde oluyor ve daha gelişmiş istatistiksel tahliller için ham bilgiyi derleyip temizliyor.
Otomatik data kazıma teknolojilerini kullanarak günlük, saatlik ve hatta daha yüksek sıklıkta bilgi yapısıyla optimal bilgi derleme stratejileri elde edilebiliyor. bu biçimdece, ayrıntılı metaveri ayrıntıları derlenerek hesaplamalar geliştirilebiliyor. Bu usulde genel hedef, web sitesinde yer alan HTML formatındaki bilgiyi tahlil ve hesaplamalar için daha uygun yapılara dönüştürmek.
Kriterlere nazaran web sitesi seçiliyor
Bu yolda, uygun web sitesi seçimi için kimi kriterler de aranıyor. Bunun için sitenin temsiliyet, hacim, içerik kaynağı, sürdürülebilirliği, teknik özellikleri, metaveri ve amaç değişkenleri üzere ögelere bakılıyor.
TÜİK, internetten data kazıma çalışmaları kapsamında 2020 yılında TÜBİTAK ile ortaklaşa TÜİK Büyük Data İleri Analitik Projesi’ni gerçekleştirdi. Bilgi kaynakları olan firmalardan gerekli müsaadeler alınarak, internetten data kazıma fiyat derleme yolunun altyapısı hazırlandı.
Proje kararı gelen ham bilgi, TÜİK teknik işçisi tarafınca tahlil edildi, yanılgılar belirlendi ve fiyat derlenebilecek hale getirildi. sonrasındasında bilginin tablo formatında, fiyat takibi yapılabilir ve data tahliline uygun olması sağlandı.
Eserlerin fiyatı yıl boyunca takip edilecek
Beyaz eşya, elektronik eserler, mobilya, birinci el arabalar ve otobüs bileti meblağları için 2022 yılı prestijiyle internet üzerinden derlenen fiyatlar endeks hesaplamalarında kullanılacak. Aralık ayı temel alınarak takibi kararlaştırılan mamüllerin fiyatı, eser kodu ya da eser barkodu üzerinden yıl boyunca takip edilecek. bu biçimdece birebir kalitedeki mamüllerin fiyat gelişimleri endeks hesaplamalarına yansıtılacak. Bu kapsamdaki fiyatların sayısı aylık yaklaşık 20 bin civarında.
Bilgi kazıma yoluyla elde edilen bilgiler günlük olarak takip edilerek fiyat değişim tahlilleri de yapılıyor. Ayrıyeten fiyatı gelen mamüllerin satışının devamlılığı da fiyat derleme devri ortasındaki fiyat sayıları denetim edilerek gözleniyor.
İnternet verisinin kullanması yaygınlaştırılacak
Gelecek periyotta yeni sisteme adapte edilen eser fiyatlarının günlük olarak data akışı sağlanacak, tahlilleri yapılacak ve öbür bilgi derleme halleri olan barkod ve alan verisiyle birlikte fiyat derleme devrinin sonunda endeks hesaplamalarında kullanılacak. TÜFE kapsamında derlenen aylık fiyatların yaklaşık olarak yüzde 40-45’i barkod ve internetten data kazımayla elde edilmiş olacak ve bu biçimdece bilgi, kaynağında mümkün olan en hakikat haliyle derlenecek.
TÜİK, bu kapsamda en az maliyetle en hakikat bilgiyi elde edebilecek. Bu amaç doğrultusunda öteki ülke çalışmaları da dikkate alınarak barkod ve internet datalarının kullanmasının yaygınlaştırılması öngörülüyor.