Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses
Permanent URI for this collectionhttps://gcris3.etu.edu.tr/handle/20.500.11851/280
Browse
Recent Submissions
Master Thesis Üç Boyutlu Evrişimsel Sinir Ağları İle Finansal Zaman Serisi Analizi(2025) Akan, Barış; Özbayoğlu, Ahmet MuratYapay sinir ağları, finansal zaman serisi tahmininde son yıllarda oldukça yaygın biçimde kullanılmaktadır. Özellikle karmaşık, doğrusal olmayan ilişkileri modelleyebilme yetenekleri sayesinde geleneksel yöntemlerin önüne geçmektedir. Bu kapsamda zaman bağımlılıklarını etkili bir şekilde öğrenebilen Kısa Uzun Süreli Hafıza (LSTM) tabanlı modeller finansal verinin tahmininde oldukça fazla kullanılmaktadır. Evrişimsel Sinir Ağları (CNN) da literatürde kendisine yer bulmaya başlamış ve çeşitli çalışmalarda başarılı sonuçlar elde edilmiştir. Bu çalışmada ise klasik CNN yaklaşımlarının ötesine geçilerek, konvolüsyon işlemi üç boyutlu veri yapısı üzerinde gerçekleştirilmiştir. Bu yeni yaklaşımda, veri hazırlama süreci detaylı şekilde tasarlanmıştır. İlk olarak, teknik analizde yaygın olarak kullanılan 20 farklı indikatör seçilmiş; her bir indikatör, 5 ile 25 gün arasındaki 20 farklı periyot için hesaplanarak, her gün için 20x20 boyutunda iki boyutlu bir matris oluşturulmuştur. Ardından, bu iki boyutlu veriye ardışık 20 günlük geçmiş veriler eklenmiş ve sonuç olarak her bir gün için 20x20x20 boyutunda üç boyutlu veri elde edilmiştir. Bu veri yapısı, CNN modelinin zaman, indikatör ve periyot bilgilerini aynı anda işlemleyerek daha karmaşık örüntüleri öğrenmesine olanak tanımaktadır. Etiketleme sürecinde ise her gün için fiyat hareketine göre 'Al', 'Sat' ve 'Tut' olmak üzere üç sınıftan biri atanmıştır. Model, bu sınıflandırmayı öğrenerek gelecekteki alım-satım sinyallerini tahmin etmeyi hedeflemiştir. Modelin tahminlerine dayanarak oluşturulan alım-satım stratejileri, 2022–2024 yılları arasında toplam 750 işlem gününü kapsayan bir dönem boyunca Dow Jones 30 endeksine dahil olan hisseler ile çeşitli borsa yatırım fonları (ETF) üzerinde test edilmiştir. Gerçekleştirilen işlemler sonucunda, hisseler için yıllık ortalama %23.87, ETF'ler için ise %19.40 oranında getiri sağlanmış ve bu sonuçlar geleneksel 'al ve tut' stratejisine kıyasla daha yüksek performans göstermiştir. Böylece önerilen modelin, zaman serisi verilerinde teknik göstergelerin çok boyutlu temsilinden faydalanarak etkili bir tahmin performansı sergileyebildiği ortaya konmuştur.Master Thesis MultiAIGCD: Çoklu Model, Dil, İstem ve Senaryolarda Yapay Zeka Tarafından Oluşturulan Kodların Tespiti için Yeni Bir Veri Kümesi(2025) Demirok, Gökçe Başak; Özbayoğlu, Ahmet Murat; Kutlu, MücahidSon yıllarda büyük dil modellerinin (BDM - LLM: Large Language Models) hızlı bir şekilde gelişmesiyle birlikte, bu modellerin yazılım geliştirme süreçlerinde kod üretimindeki rolü de dikkate değer ölçüde artmıştır. Bu ilerleme, yazılım üretimini daha hızlı ve erişilebilir kılarken; özellikle eğitim, işe alım ve değerlendirme süreçlerinde ciddi etik ve güvenilirlik sorunlarını da beraberinde getirmiştir. Öğrencilerin ödevlerde yapay zeka destekli araçlarla kod üretmesi veya adayların mülakat süreçlerinde bu tür araçlardan yararlanması, akademik dürüstlük ve adil değerlendirme ilkelerini tehdit etmektedir. Bu bağlamda, yapay zeka tarafından üretilmiş kodları güvenilir şekilde tespit edebilen sistemlerin geliştirilmesi, yalnızca teknik değil aynı zamanda sosyal bir zorunluluk haline gelmiştir. Bu çalışmada, Python, Java ve Go dillerinde üretilmiş yapay zeka kaynaklı kodların tespiti için oluşturulan MultiAIGCD veri kümesi tanıtılmaktadır. Veri kümesi, CodeNet veri setindeki problem tanımlarından ve insan yazımı kodlardan yararlanılarak oluşturulmuştur. Bu problemler üzerinden, altı farklı BDM kullanılarak üç farklı istem (prompt) türüyle çok sayıda yapay kod örneği üretilmiştir. Kod üretimi sürecinde üç temel senaryo dikkate alınmıştır: (i) problem tanımından sıfırdan kod üretimi, (ii) insan yazımı kodlardaki çalışma zamanı (runtime) hatalarının düzeltilmesi, (iii) insan yazımı kodlardaki hatalı çıktıyla sonuçlanan kodların düzeltilerek doğru çıktılar üretmesinin sağlanması. Bu sistemli üretim süreci sonucunda MultiAIGCD toplamda 121,271 adet yapay zeka tarafından oluşturulmuş ve 32,148 adet insan tarafından yazılmış kod parçacığı içeren büyük ölçekli ve dengeli bir veri kümesine dönüşmüştür. Ayrıca çalışmamızda, alandaki güncel yapay zeka kod tespiti sistemlerinden üç tanesi bu veri kümesi üzerinde değerlendirilmiş ve modellerin farklı test senaryolarındaki başarıları analiz edilmiştir. Değerlendirme sürecinde çapraz model (cross-model) ve çapraz dil (cross-language) gibi gerçekçi ve zorlu senaryolar özel olarak ele alınmıştır. Sunmuş olduğumuz bu veri kümesi ve beraberindeki açık kaynak kodlar, yapay zeka tarafından üretilen kodların tespiti alanındaki araştırmaları desteklemek amacıyla kamuoyuyla paylaşılmaktadır. Bu sayede, hem akademik hem de endüstriyel düzeyde daha güvenilir, adil ve şeffaf değerlendirme sistemlerinin geliştirilmesine katkı sağlanması hedeflenmektedir.Master Thesis Endüstri Saldırısı Savunmalarının Güvenli ve Düşük Maliyetli Hale Getirilmesi(2025) Canpolat, Oğuzhan; Ergin, OğuzModern DRAM'de okuma hataları, bir DRAM satırına tekrar tekrar erişildiğinde, fiziksel olarak yakın diğer DRAM satırlarında bit hatalarına yol açan önemli bir sağlamlık (güvenlik, emniyet ve güvenilirlik) problemidir. Teknoloji düğüm boyutunun küçülmesi, nesiller boyunca DRAM okuma hatalarını şiddetlendirmektedir. Okuma hatalarını hafifletmek amacıyla, en son DDR5 standardı PRAC adı verilen yeni bir RowHammer önleme çerçevesi tanıtmıştır. PRAC, 1) her satıra bir etkinleştirme sayacı tahsis ederek DRAM yongasının satır etkinleştirmelerini doğru şekilde takip etmesini sağlar ve 2) yeni bir geri çekilme (-ing, back-off) sinyali tanıtarak DRAM yongasına SatırDarbesi önleyici tazeleme işlemlerini gerçekleştirebilmesi için gerekli zaman penceresini sunar. Ne yazık ki, PRAC'ın güvenlik garantileri ve ek yükleri önceden kapsamlı biçimde incelenmemiştir. Bu çalışmada, 1) PRAC'ın güvenlik, başarım, enerji ve maliyet açısından ilk kapsamlı analizini sunuyoruz ve 2) PRAC'ın iki temel zayıflığını gideren Chronus adlı yeni bir mekanizma öneriyoruz. Analizimiz, PRAC'ın masum uygulamalarda sistem başarımı açısından göz ardı edilemeyecek bir ek yük getirdiğini, gelecekteki DRAM yongalarında ise bu yükün kabul edilemeyecek seviyelere ulaştığını gösteriyor. Bu yüklerin kaynağı olan iki temel zayıflık tespit ediyoruz: Birincisi, PRAC etkinleştirme sayaçlarının artırılması için gereken ek süre nedeniyle kritik DRAM erişim gecikme parametrelerini artırıyor. İkincisi, PRAC her seferinde sabit sayıda önleyici tazeleme işlemi gerçekleştiriyor; bu da onu dalga saldırısı (-ing, back-off) olarak bilinen düşmanca erişim desenine karşı savunmasız kılıyor ve dolayısıyla çok daha düşük etkinleştirme eşikleriyle yapılandırılmasını gerektiriyor. PRAC'ın bu iki zayıflığını gidermek için, DRAM yongası üzerinde çalışan yeni bir SatırDarbesi önleme mekanizması olan Chronus'u öneriyoruz. Chronus, 1) sayaçları veriden ayırarak erişim hizmeti verirken satır etkinleştirme sayaçlarını eşzamanlı günceller ve 2) gerçekleştirilen önleyici tazeleme sayısını dinamik olarak kontrol ederek dalga saldırısını engeller. Başarım analizimiz, Chronus'un sistem başarımı üzerindeki ek yükünün modern DRAM yongaları için sıfıra yakın, gelecekteki DRAM çipleri içinse oldukça düşük olduğunu göstermektedir. Chronus, PRAC'ın üç varyantını ve diğer üç son teknoloji okuma bozulması çözümünü geride bırakmaktadır. Chronus ve PRAC'ın gelecekteki sistemler üzerindeki etkilerini tartışıyor ve ileriye dönük araştırma yönlerine işaret ediyoruz. Gelecekteki araştırmaları desteklemek amacıyla, Chronus'un tüm kaynak kodunu yayınlıyoruz: https://github.com/CMU-SAFARI/ChronusMaster Thesis Mqtt Ağına Gerçekleştirilen Saldırıların Makine Öğrenmesi Modelleri ile Tespiti(2025) Koçak, Mesut; Selçuk, Ali AydınNesnelerin İnterneti (IoT)'nin hızlı gelişimi, çok sayıda cihazın ağlar üzerinden veri paylaşımını mümkün kılmış ve birçok sektörde kayda değer ilerlemelere zemin hazırlamıstır. IoT cihazları arasındaki bu veri alışverişini verimli kılmak amacıyla çeşitli iletişim protokolleri kullanılmaktadır. Bu protokoller arasında, MQTT (Message Queuing Telemetry Transport), düşük bant genişliği gereksinimi ve hafif yapısı ile IoT sistemleri için ideal bir iletişim mekanizması olarak öne çıkmaktadır. Ancak, MQTT protokolünün yaygın benimsenmesi, bu ağlara yönelik siber saldırılar karşısında çeşitli güvenlik açıklarının ortaya çıkmasına da neden olmuştur. Bu çalışma, MQTT ağlarına özgü saldırıların tespitine yönelik olarak makine öğrenmesi tekniklerinin kullanımını incelemekte ve olası tehditlerin belirlenmesini amaçlamaktadır. Çalışmada, özellikle SlowITe ve veri setine sonradan entegre edilen SlowTT saldırı türleri üzerine odaklanılmıştır. Kullanılan veri seti MQTTset, başlangıçta SlowTT saldırılarına ilişkin verileri içermediği için bu saldırılara ait veriler çalışma kapsamında sonradan eklenmiştir. Dengeli bir veri yapısı sağlamak amacıyla, veri setinin %50'si normal trafik verilerinden, geri kalan %50'si ise eşit sayıda SlowITe, SlowTT, Brute Force, Malformed, DoS (Denial of Service) ve Flood saldırılarından oluşturulmuştur. Dengeli veri seti kullanımı, dengesiz veri setlerinin yaygın sınıfı daha iyi tahmin etme eğilimi sorununu ortadan kaldırmakta ve bu sayede tüm sınıfların adil bir şekilde değerlendirilmesini sağlamaktadır. Böylece, algoritmaların performans ölçümleri daha güvenilir hale gelmiştir. Yapılan testlerde, bazı modeller daha düşük performans gösterse de dengeli veri kullanımı sayesinde sınıflar arasında daha doğru bir dağılım ve gerçekçi sonuçlar elde edilmektedir. Çalışmada, dengeli veri seti üzerinde Random Forest, XGBoost, LightGBM, DNN (Deep Neural Network) ve CatBoost gibi farklı makine öğrenmesi algoritmaları ile kapsamlı deneyler gerçekleştirilmistir. İlk aşamada, yeni MQTTset veri seti üzerinde yapılan testlerde, Random Forest modeli en yüksek başarı oranlarını göstermiştir. Diğer modeller de kabul edilebilir performans sergilemiş olmakla birlikte, DNN modeli görece daha düşük bir başarı sergilemiştir. Çalışmanın ikinci aşamasında, veri setine yeni özellikler (TCP window size ve frame time delta) eklenmiş ve bu genişletilmiş veri seti ile aynı modeller tekrar test edilmiştir. Eklenen bu özelliklerle modellerin performansında genel bir artış gözlemlenmiş ve Random Forest, XGBoost, LightGBM ve CatBoost modelleri yüksek başarı oranlarına ulaşmıştır. Ayrıca, kullanılan modellerin sonuçlarını daha derinlemesine incelemek ve hangi özelliklerin model performansına en fazla katkıyı sağladığını belirlemek amacıyla LIME (Local Interpretable Model-agnostic Explanations) ve SHAP (SHapley Additive exPlanations) yöntemleri kullanılmıştır. SHAP analizi, saldırı tespitinde kullanılan makine öğrenmesi modellerinin anlaşılabilirliğini artırmış ve hangi özelliklerin tespit sürecine en fazla katkıyı sağladığını açıkça ortaya koymuştur. Sonuç olarak, bu çalışma, MQTT ağlarına yönelik saldırıların tespitinde makine öğrenmesi tabanlı yaklaşımların etkinliğini göstermektedir. Veriye eklenen yeni özelliklerin saldırı tespit performansını önemli ölçüde artırdığı ve SHAP yöntemi ile hangi özelliklerin tespit sürecinde kritik bir rol oynadığının daha net bir şekilde anlaşıldığı görülmüştür. Bu çalışmada kullanılan yöntemler, IoT ağlarının güvenliğini sağlamada önemli katkılar sunmakta ve potansiyel saldırıların erken tespiti için etkili çözümler sağlamaktadır.Master Thesis Türkçe'de Eş Anlamlı Kelimelerin Hesaplamalı Diyakronik Analizi(2024) Yazar, Umur Togay; Özbayoğlu, Ahmet MuratTürkçe 1920'lerden günümüze kadar gelen süreçte Dil Devrimi'nin etkisiyle önemli yapısal değişikliklere uğradı. Dil Devrimi'nin amaçlarına uygun olarak Türkçe üzerinde yabancı dillerin etkisini azaltacak şekilde adımlar atıldı. Bu müdahaleler sebebiyle dile pek çok yeni kelime girerken bir o kadar kelime de günümüzde kullanılmamaya başlandı. Kelime dağarcığındaki değişimlerin dışında dilin imla ve gramer kurallarında da değişiklikler görüldü. Bu çalışmada Türkçe'nin bu hızlı değişimini motivasyon kabul ederek bu çalışmada eş anlamlı kelimelerin diyakronik hesaplamalı diyakronik analizi gerçekleştirildi. İlk olarak 1920'lerden 2020'lere kadar dönemi kapsayan modern Türkçe'nin en büyük diyakronik korpusu Turkronicles'ı oluşturuldu ve bu korpus üzerinde frekans analizleri gerçekleştirildi. Ayrıca korpusla beraber diyakronik analizlerde n-gram'lar, diyakronik kelime vektörleri, bir yazılım kütüphanesi, dijitalleştirilmiş karşılıklar sözlüğü gibi çeşitli kaynakları kullanıma sunuldu. Analizlerimiz sonucunda Türkçe'nin kelime dağarcığının yıllar geçtikçe önemli ölçüde değiştiğini gördük. İmla kurallarının nasıl değiştiğini gözlemlemek için spesifik olarak sonu -b/-p ve -d/-t ile biten kelimeleri inceledik ve benzer bir sonuçla karşılaşıldı. Analizler bütünüyle ele alındığında oluşturduğumuz kaynakların aslında diyakronik analiz için uygunluğunu gösterdi veviii dilin ne ölçüde değiştiğini gözler önüne serdi. Ardından bu kaynakları kullanarak farklı tarihlerde kullanılmış eş anlamlı kelimeleri tespit etmeye yarayan iki farklı yöntem önerdik. Bu yöntemler esasında ortogonal dönüşüm matrisini bulmaya dayanır. Sonrasında önerdiğimiz yöntemler doğrusal dönüşüm matrisine dayalı temel bir yöntem ile karşılaştırıldı. Yöntemlerin başarısı iki farklı vektör algoritması üzerinden test edildi. Buna ek olarak zaman farkı arttıkça yöntemlerin performansının nasıl değiştiği gözlemlenip değerlendirildi. Deneylerin sonuçlarında önerilen yöntemlerin temel yöntemden daha iyi bir performans sergilediğini ve zaman farkına daha dayanıklı olduğu gözlemlendi. Son olarak eş anlamlı kelimelerin zamanla anlamının nasıl değiştiğini görmek adına çeşitli deneyler yürütüldü. Spesifik olarak eş anlamlı kelimelerin anlam daralması ve genişlemesi dinamikleri incelendi. İlk olarak Turkronicles korpusunda yer alan hatalı kelimeleri düzeltmek için bir Kodlayıcı-Çözücü modeli eğitildi ve bir test kümesi oluşturuldu. Hatalı kelimeler düzeltildikten sonra anlam daralması ve genişlemesini kelime ilişki çizgesi ve bir merkeziyet ölçütü etrafında modellendi. Ardından bu ölçütün bir eş anlamlı çifti için zaman boyunca nasıl değiştiğini gözlemlemek için Spearman korelasyon katsayısını hesaplandı. Son olarak birbirlerinin değişimini ne kadar etkilediğini ölçmek için bir Doğrusal Karma Model eğitildi. Deney sonuçlarına dayanarak eş anlamlı bir kelimenin anlamı genişlerken diğerinin anlamının daraldığı tespit edildi.Master Thesis Kısmi Yük Yenileme Tekniği ile Satırdarbesi Önleme Mekanizmalarının Performansının İyileştirilmesi(2024) Tuğrul, Yahya Can; Ergin, OğuzModern DRAM çiplerinde gerçekleşen okuma hataları, bellek yalıtımını bozabilen yaygın bir zayıflıktır. Bellek yalıtımı, bellek güvenliği ve güvenilirliğinin temel yapı taşlarından biridir. SatırDarbesi zafiyeti, DRAM'deki okuma hatalarına önemli bir örnektir; burada DRAM hücrelerinin bir satırına (DRAM satırı) tekrar tekrar erişmek (darbeleme), fiziksel olarak yakın DRAM satırlarında (kurban satırlar) bit hatalarına neden olur. Ne yazık ki, teknoloji düğüm boyutunun küçülmesi SatırDarbesi zafiyetini kötüleştirir ve böylece, daha yeni DRAM çip nesillerinde daha az erişim yaparak SatırDarbesi bit hataları oluşturulabilir. Güvenilir DRAM kullanımı için, son teknoloji SatırDarbesi önleme mekanizmaları potansiyel kurban satırlardaki DRAM hücrelerinin yükünü yeniler (önleyici yenileme ya da yük yenileme). Gerçekleştirilen bu önleyici yenileme operasyonu DRAM çipini bir süre kilitleyerek performans kayıplarına yol açar. Daha yeni DRAM çip nesilleri ile bu mekanizmalar önleyici yenilemeyi daha sık gerçekleştirir ve daha büyük performans kayıplarına neden olur. Güvenilirlik ve güvenlikten ödün vermeden bu kaybı azaltmak için bizim amacımız, önleyici yenileme için harcanan zamanı azaltmak ve bu azaltılmış zamanın SatırDarbe zafiyeti üzerindeki etkisini anlamaktır. Bu amaçla, gerçek DRAM çiplerinde veri tutma süresi, yük yenileme ve SatırDarbesi zafiyetinin özellikleri arasındaki etkileşimlere dair ilk kapsamlı deneysel çalışmayı sunuyoruz. Üç büyük DRAM üreticisinden toplam 388 DDR4 DRAM çipini test ediyoruz ve bir yük yenileme operasyonunun gecikmesinin önemli ölçüde azaltılabileceğini (%64 oranında) ve dolayısıyla, biraz daha fazla (%0,54 oranında) önleyici yenileme operasyonu gerektireceğini gözlemliyoruz. Bu gözlemimizi kullanarak, yük yenileme gecikmesini dinamik olarak ayarlayan, mevcut SatırDarbesi önleme mekanizmalarının saldırganlığını düzenleyen ve bellek kontrolcüsü tabanlı düşük maliyetli bir mekanizma olan Kısmi Yük Yenileme ile Agresif Önleme'yi (PaCRAM) öneriyoruz. PaCRAM'i beş son teknoloji SatırDarbesi önleme mekanizması ile kullanarak önleme mekanizmalarının performans (enerji) kayıplarını sırasıyla ortalama olarak %18,95 (%14,59), %12,28 (%11,56), %2,07 (%1,15), %2,56 (%2,18) ve %5,37 (%4,50) oranında azaltarak sistem performansını ve enerji verimliliğini önemli ölçüde artırıyoruz.Master Thesis Elektrikli Otobüslerde Çizge Tabanlı Öznitelik Seçimi ve Makine Öğrenmesi ile Kestirimci Bakım(2024) Erçevik, Ayşe Irmak; Özbayoğlu, Ahmet MuratBu tez çalışmasında, elektrikli otobüslere ait CAN (Controller Area Network) Bus verileri kullanılarak çizge tabanlı öznitelik seçim yöntemi ile sistemin özellikleri arasındaki ilişkiler analiz edilmiş ve üretici tarafından hedeflenen alarmların yapay zekâ teknikleri ile kestirim performansı araştırılmıştır. Araştırmada belli bir süre boyunca, farklı araçlardan elde edilen CAN Bus verileri kullanılmıştır. Ham veri paketleri üzerinde kapsamlı ön işleme teknikleri uygulanmış ve makine öğrenmesi modellerinin yapısal ihtiyaçlarına uygun veri setleri oluşturulmaya gayret edilmiştir. Bu süreçte Pearson korelasyon analizi, Cramer's V istatistik tablosu ve Anova F-testi gibi istatiksel filtreleme yöntemleri ve InfoMap, Leiden, Louvain, Fast Greedy gibi optimizasyon tabanlı topluluk tespiti algoritmaları kullanılarak, hibrit çizge tabanlı öznitelik seçim aracı geliştirilmiştir. Geliştirilen araç kullanılarak özellik altkümeleri belirlenmiş, özelliklerin ilişkisel konumu ve hedeflenen alarmlarla ilişkileri değerlendirilerek ayırt edici öznitelikler seçilerek boyut azaltımı yapılmıştır. Makine öğrenmesi modellerinin seçilmesinde, Destek Vektör Makinesi (SVM), Rastgele Orman (RF), eXtreme Gradient Boosting (XGBoost), Uzun Kısa Süreli Bellek (LSTM), ve Tekrarlayan Sinir Ağları (RNN) modelleri dahil olmak üzere sinir ağı mimarileri ve geleneksel sınıflandırıcılar uygulanarak performansları değerlendirilmiştir. Sınıf dengesizliğinin modellerin performansındaki etkisini minimize etmek için SMOTEEN (Synthetic Minority Oversampling Technique-Edited Nearest Neighbours) ve ikili arama tabanlı zaman aralığı örnekleme (binary search based time interval down-sampling) yöntemleri uygulanmıştır. Her modelin en iyi ayırt edici sınıflandırıcı uzayını bulmak için Izgara Arama (Grid Search) ve Rastgele Arama (Random Search) tabanlı hiperparametre optimizasyonu (Hyperparameter tuning) yapılmıştır. Geliştirilen modellerin performansları geçerleme (validation) metrikleri esas alınarak değerlendirilmiştir. Modellerin kestirimleri özniteliklerin ağırlıkları incelenerek ve LIME (Local Interpretable Model-Agnostic Explanations) aracı kullanılarak açıklanmaya çalışılmış, kestirimleri tetikleyen öznitelikler belirlenmiş ve sistemin işleyişi (tasarımı) ile ilgili içgörüler elde edilmiştir. Bu çalışma kapsamında CAN Bus verileri kullanılarak araçlardaki belli alarmların makine öğrenmesi teknikleri ile kestirim performansı araştırılmış, çizge tabanlı bir öznitelik seçme aracı geliştirilerek düzeltici, önleyici, kestirimci ve proaktif bakım (tasarımın iyileştirilmesi) yaklaşımlarının iyileştirilmesine yardımcı olacak şekilde öznitelikler arasındaki ilişkilerin görsel olarak yorumlanması imkânı sağlanmıştır. Çalışmada izlenen makine öğrenmesi yaşam döngüsü kapsamında uygulanan tekniklerin farklı sektörlerde ve Endüstri 4.0 gereği bakım stratejilerinin makine öğrenimi yoluyla iyileştirilmesinde, özellikle veri kalitesi ve uzman görüşüne erişim zorluğu olan projelerde yararlı olabileceği değerlendirilmektedir. Anahtar Kelimeler: Kestirimci bakım (PdM), Makine öğrenimi (ML), Çizge tabanlı öznitelik seçimi, Açıklanabilir yapay zekâ (XAI).Master Thesis Blokzincir Tabanlı Gizlilik Korumalı İstatistiksel Hesaplamalar(TOBB ETÜ, 2023) Mutlu, Zeynep Delal; Selçuk, Ali̇ AydınBu çalışmada, üçüncü taraflarca sağlanan gizli veriler üzerinde istatistiksel hesaplamalara izin vermek için akıllı sözleşmeler ve homomorfik kriptografi kullanan blokzincir tabanlı bir uygulama mimarisi önerilmektedir. Blokzincir kullanımı, bütünlük ve hata toleransı gibi güvenlik özelliklerini sağlarken; homomorfik şifreleme ise verilerin gizliliğini korur. Bu temel güvenlik prensiplerinin dışında, uygulama mimarisi geliştirilirken veri aktarımı ve veri depolama aşamalarında ayrıca güvenlik sağlayabilecek hassasiyette yaklaşımlar kurgulanmıştır. Yapılan literatür taramasında, bu tez kapsamındaki konulara benzer konulara rastlanmışsa da; bu tez çalışması Ethereum akıllı sözleşmesinde doğrusal regresyon analizi yapması açısından diğer çalışmalardan ayrışmaktadır. Çalışma kapsamında Ethereum blokzincirine akıllı sözleşme geliştirilmiş, bu akıllı sözleşmeye veri gönderen ve verileri okuyan kullanıcılar için ayrı ayrı kullanıcı betikleri yazılmıştır. Çalışmanın örnek senaryosu doğrusal regresyon analizi üzerinden geliştirilmiştir. Doğrusal regresyon analizi ile üçüncü taraflardan toplanan veriler şifrelenerek akıllı sözleşmeye şifreli bir biçimde gönderilir. Akıllı sözleşmeye gelen şifreli veriler ilgili değişkenlerde homomorfik toplama işlemi ile toplanarak kaydedilir. Daha sonra akıllı sözleşmeden şifreli verileri okumak isteyen kullanıcı bu değerleri okur ve işlemlerini gerçekleştirir. Çalışmanın ilerleyen bölümlerinde önerilen sistemin tasarımı, uygulaması ve farklı homomorfik anahtar uzunluklarına dayalı sonuçları sunulmaktadır. Uygulamanın sayısal sonuçları, akıllı sözleşmeye gönderilen farklı anahtar uzunluğuna sahip işlemlerin ne kadar zaman ve gaz ücreti tükettiğini göstermektedir. Farklı anahtar uzunluğundaki verilerin gaz ücreti ve zaman tüketimlerindeki benzerlikler, farklılıklar ve bunların sebepleri tartışılmıştır. Ayrıca değerlendirmeler kısmında, önerilen sistemin getirdiği güvenlik iyileştirmelerinin neler olduğuna da ışık tutulmaktadır. Önerilen mimari, tüm istatistiksel hesaplamalarda kullanılabilecek genel bir bakış açısı kapsamında geliştirilmiştir. İstenildiği takdirde uygulama adımları tekrarlanarak farklı istatistiksel hesaplamalar için de sistem tasarımı yapılabilir. Çalışma, akıllı bir sözleşme aracılığıyla homomorfik hesaplamalara sahip blokzincir tabanlı veri paylaşım mekanizmasının uygulanabilir olduğunu ve verilerin yetkisiz kullanıcılardan korunmasında iyileştirmeler yapılabildiğini göstermektedir.Master Thesis Sosyal Medyada Kullanıcı Gizliliğini Korumak için Taraf Tespiti Görevinde Dönüştürücü Dil Modellerini Yanıltma Yöntemleri(TOBB ETÜ, 2023) Doğan, Di̇lara; Kutlu, Mücahi̇dDoğal dil işleme alanındaki heyecan verici yeni gelişmeler dillerin karmaşıklıklarının daha iyi anlaşılmasını, metinler üzerinden yapılan anlam çıkarımları ve analizlerle daha başarılı sonuçlar ortaya koyulmasını sağlamıştır. Doğal dil işleme modelleri için geniş veri kümeleri sunan sosyal medya platformlarının kullanımı her geçen gün artarak insanların günlük hayatlarının önemli bir parçasına haline gelmiştir. İnsanlar, sosyal medya platformları üzerinden paylaştıkları metinlerde duygularını, düşüncelerini, deneyimlerini ve kendileriyle ilgili kişisel birçok bilgiyi ifade edebilmektedir. Yapay zekâ modellerinin, bu verileri insanların takip edilmesinde kullanabilmesi, kullanıcılarda önemli gizlilik endişelerini de beraberinde getirmiştir. Bu tez çalışmasında, sosyal medya platformlarını kullanan bireylerin yapay zekâ modelleri tarafından tespit edilememeleri için yapabileceklerini araştırıyoruz. Araştırmamızda birçok konuda kullanıma açık olan taraf tespiti görevini çeşitli konulardaki Türkçe ve İngilizce veri kümeleriyle ele alıyoruz. BERT ve BERTurk tabanlı dönüştürücü modellerini, yanıltmak amacıyla yeniden ifade etme ve kasıtlı yazım hataları yapma tabanlı yöntemler öneriyoruz. Önerilen 13 farklı yöntemin modellerin performanslarını etkileme seviyelerine göre etkinliklerini araştırıyoruz. Deneylerimiz sonucunda, yazım hataları karşısında BERT ve BERTurk tabanlı modellerin performanslarının belirgin bir şekilde düştüğü gösterilmiştir. Yazım hatalarına yönelik yöntemlerden iki dilde de en etkili yöntemlerin görsel olarak benzer karakterleri birbirleri yerine kullanma, boşluk ekleyerek kelimeyi bölme ve kelimelerdeki harflerin sıralarını karıştırma olduğu sonucuna ulaşılmıştır. Fakat bunula birlikte, yeniden ifade etme yöntemlerinin bu modellerin performanslarını etkileme konusunda başarılı olmadığı görülmüştür. Yöntemlerin uygulanmasında manuel ve otomatik olmak üzere iki farklı yöntem kullanılmıştır. Yöntemlerin otomatik uygulanması sonucunda elde edilen metinlerin hâlâ eski anlamlarını koruyarak okunabilir olması istenmiştir. İki değerlendirici tarafından bu kontroller sağlanmış olup harf sıralarını karıştırma, hashtag silme ve boşluk ekleme yöntemleri kullanılarak yapılan otomatik değişiklikler sonucunda okunurluğun azalması ve anlam değişmeleri gibi durumlar tespit edilmiştir. Bu sebeple bu yöntemlerin uygulanması konusunda daha dikkatli olunması gerektiği sonucuna ulaşılmıştır. Diğer bir nokta ise hashtag'lere dayalı yöntemlerde hashtag seçimleri oldukça önemli olup modellerin daha iyi performans göstermesine de sebep olabilmektedir. Bununla birlikte hashtag silme ve hashtag kullanılmaması çoğu durumda daha etkili sonuçlar vermiştir. Önerdiğimiz yöntemler ve elde ettiğimiz sonuçlar, bilgi ve gizliliklerini yapay zekâ modellerinden korumak isteyen kullanıcılar için yol gösterici nitelik taşımaktadır.Master Thesis Özyinelemeli Çizim Tabanli Sinirsiz Kapali Alan Sanal Gerçeklik Motoru Gelistirilmesi(TOBB ETÜ, 2022) Gülcü, Ali Emre; Selçuk, Ali AydınSanal gerçeklik donanımları geçmişten beri askeri simülasyonlar ve tıbbi uygulamalar gibi gerçeklik gerektiren alanlarda kullanılmaktadır. Gelişen teknoloji ile birlikte maliyetin düşmesiyle sanal gerçeklik donanımları sıradan kullanıcılar tarafından da erişilebilir bir hale geldi. Sanal gerçeklik uygulamalarının simülasyon ve eğitimlerin yanı sıra yaygın olarak oyun ve sinema sektöründe de yer bulmasıyla farklı gereksinimler ortaya çıkmaya başladı. Tıbbi uygulama ve askeri simülasyonlarda özel alanlar tahsis edilip ek donanımlar kullanılabildiği için rahat ve kullanılabilir bir sanal gerçeklik deneyimi sunulabilmektedir. Ancak kısıtlı bir fiziksel alanda ve standart donanımla sanal gerçeklik uygulamalarını deneyimleyen kullanıcılar için bu her zaman mümkün olmamaktadır. Yaygın sanal gerçeklik donanımları genellikle kullanıcının kapalı bir oda içerisinde kullanacağı varsayımı ile tasarlanır. Hareketin tamamen doğal yürüme ile sağlanamayacağı bu ortamlar için ise farklı hareket yöntemleri geliştirilmiştir. Kapalı fiziksel ortamlarda büyük sanal ortamların deneyimlenebilmesi için öne çıkan en yaygın yöntemler oyun kolu ile yürüme ve ışınlanma yöntemleridir. Bu yöntemler her ne kadar kısıtlı alan problemini çözseler de, beyin tarafından gözlemlenen hareket ile vücut tarafından hissedilen hareketin uyuşmazlığı sebebiyle mide bulantısı ve baş dönmesi gibi yan etkilere sebep olmaktadır. Bu yan etkileri çözmeyi amaçlayan geçmiş yöntemlerin bazıları ek donanım gerektirirken, bazıları da sanal ortamı bozmaktadır. Bu çalışmada yan etkileri ek donanıma gerek duymadan aşmak için portal tabanlı, sanal alanı üst üste bindirmeli bir yöntem önerip ortam tasarımı için kurallar belirledik. Sunduğumuzun yöntemin, dikkat dağıtma ve haritalama gibi doğal yürüyüş tabanlı diğer geçmiş yöntemlerle ayrıntılı karşılaştırmasını yaptık. Hareket yöntemlerine benzer bir şekilde, performans kaybının da sanal gerçeklikte kullanıcı üzerinde yan etkilere sebep olması sebebiyle, bahsi geçen grafik motorunun geliştirilmesinde en yeni teknolojiler kullanılmıştır. 1990'ların grafik mimarisine göre geliştirilmiş olan ve uyumluluk kısıtları sebebiyle yeni donanımlara ayak uydurmakta zorluk yaşayan OpenGL gibi eski bir grafik uygulama arayüzü yerine, modern grafik kartları ve çok çekirdekli işlemci mimarileri göz önünde bulundurularak geliştirilmiş olan Vulkan grafik uygulama geliştirme arayüzü tercih edilmiştir. Portal tabanlı ortamların sunulması için geliştirdiğimiz grafik motoru ise bu arayüzle tam uyumlu olacak şekilde tasarlanmıştır. Çalışma sonunda OpenGL ve Vulkan kullanılarak ayrı ayrı geliştirilmiş olan grafik motorları arasında ayrıntılı performans kıyaslaması yapılarak yeni teknolojilerin kullanılmasıyla ciddi performans artışları görüldüğü gözlemlendi. Buna ek olarak ortaya çıkan uygulamayı modern başka bir sınırsız alan yöntemi olan ortam haritalama yöntemi ile kıyaslamak için bir kullanıcı testi gerçekleştirildi. Kullanıcı testlerinin sonucunda çalışmamız büyük çoğunluk tarafından tercih edilirken özgünlüğünden dolayı da olumlu geri beslemeler aldı.Master Thesis Bloom Filtre Tabanli Bellek Uygulamalari ile Gömülü Sistemlerde ve İslemcilerde Etkinlestirilmis Truva Atinin Belirlenmesi(TOBB ETÜ, 2022) Bolat, Alperen; Ergin, OğuzDonanım Truva Atları (DTAlar), modern işlemci tabanlı sistemler için birtakım güvenlik risklerini meydana getirir. İşlemcide yürütülen programın değiştirilmesi, programa ait olmayan buyrukların işlemciye gönderilmesi, program üzerinde analizler ile programcının veya donanımın kritik bilgilerinin ele geçirilmesi ve kaynaklar arasında doğrulamanın engellenmesi gibi birçok güvenlik zafiyetiyle birlikte getirilir. Bloom filtre tabanlı bellek uygulamaları ile işlemci içerisindeki yürütmenin güvenilir olmasını sağlamak mümkündür. Bloom filtrenin sağladığı sorgulama ve eğitim yeteneği sayesinde, buyruklar ve bellek adresleri veri seti ile eğitim yapılır ve yürütme sırasında bu eğitilen veriler sorgulanır. Bu sayede işlemcideki yürütmenin güvenilir ve doğrulanmış olması sağlanır. Diğer taraftan, işlemci ile derleme kaynağı arasında belirlenecek bir takım şifreleme ve güvenli ağ protokolleri ile kaynakların birbirini doğrulaması ve sisteme yapılan dış müdahalelerin oluşturacağı sorunlar engellenebilir. Bu tez çalışmasında belirtilen güvenlik zafiyetlerini engelleyecek mimari tasarımlar ile ilgili çalışmalar sunulmaktadır. Tezde tartışılan ilk çalışma DTA aktivasyonunu tespit etmeyi öneren bir işlemci mimarisidir.Önerdiğimiz mimari, geçici olarak tasarlanmış denetleyicilere dahil edilen ve koruma mimarisine entegre edilen Bloom Filtrelerinin kullanımına dayanmaktadır. Bloom filtreler sıfır yanlış alarmı ve küçük (ve yapılandırılabilir) algılanmayan alarm oranını garanti eder. Koruma mimarisini, bir FPGA üzerinde uygulanan ve bir dizi yazılım kıyaslaması çalıştıran bir RISC-V mikroişlemcisine dayalı bir vaka inceleme sistemine uyguladık. Sonuçlar önerdiğimiz mimarinin olası DTA aktivasyonlarının %99'undan fazlasını sıfır yanlış alarmla tespit edebildiğini gösterildi. %0,68 ile %10,52 arasında değişen bir arama tablosu ek yükü ve %0,68 ile %0,99 arasında bir flip-flop ek yükü ölçtük ve sistemin çalışma frekansında herhangi bir azalmaya neden olmadık. Tezde tartışılan diğer bir çalışma ise işlemci içerisindeki yürütmenin güvenliğini sağlamak ve başta DTA aktivasyonu olmak üzere saldırganlardan programın kendisini ve işlemci ile derleyici arasındaki ağı korumayı önerir. Modern bulut bilişim sistemleri, tipik olarak güvenlik açısından kritik bir kümede derlenen yazılım kaynaklarını gizli tutmak için yürütülebilir yazılımları bir ağ üzerinden dağıtır. Tez ile beraber yeni, verimli ve genel bir yazılım gizleme mimarisi çerçevesi sunan ERIC'i öneriyoruz. ERIC, yazılımı (i) yazılımın nasıl dağıtıldığına bakılmaksızın, yürütülebilir yazılımların yalnızca şifrelenmiş bir sürümünü insan gözünün kullanımına sunarak statik analize ve (ii) şifreli bir yürütülebilir dosyanın yalnızca doğru şekilde olabileceğini garanti ederek dinamik analize karşı korur. Tek bir kimliği doğrulanmış cihaz tarafından şifresi çözülür ve yürütülür. ERIC, verimli yazılım gizleme desteği sağlamak için temel donanım ve yazılım bileşenlerini içerir: (i) bir donanım şifre çözme motoru (HDE), hedef cihazdaki şifrelenmiş donanımın verimli bir şekilde şifresinin çözülmesini sağlar, (ii) derleyici, yalnızca benzersiz bir cihaz verilen yazılım yürütülebilir dosyalarını sorunsuz bir şekilde şifreleyebilir tanımlayıcı. Hem donanım hem de yazılım bileşenleri buyruk mimarisinden bağımsızdır ve ERIC'i genel kılar. ERIC'in ana fikri, fiziksel klonlanamayan işlevleri (PUF'ler), benzersiz cihaz tanımlayıcılarını, yazılım yürütülebilir dosyalarını şifrelemede gizli anahtarlar olarak kullanmaktır. Hedef cihazdaki PUF'a erişemeyen kötü niyetli taraflar, şifrelenmiş ikili dosya üzerinde statik veya dinamik analizler yapamazlar. Uçtan uca değerlendirmek için ERIC'in prototipini bir FPGA üzerinde geliştiriyoruz. Prototipimiz, yazılım şifre çözme maliyetlerini en aza indirmek için RISC-V Rocket Chip'i donanım şifre çözme motoru ile genişletir. RISC-V yürütülebilir dosyalarının kısmi/tam şifrelemesini etkinleştirmek için özel LLVM tabanlı derleyiciyi genişletiyoruz. HDE, küçük FPGA kaynak giderlerine maruz kalır, Rocket Chip taban çizgisine kıyasla %2,63 daha fazla arama tablosu (-ing LUT) ve %3.83 daha fazla flip flop gerektirir. LLVM tabanlı yazılım şifrelemesi, derleme süresini %15,22 ve yürütülebilir program boyutunu %1,59 artırır. ERIC'e açık kaynaklı olarLUTak https://github.com/kasirgalabs/ERIC adresinden erişilebilir.Master Thesis Güvenlik farkindalikli veritabani göçü planlamasi(TOBB ETÜ, 2022) Açıkalın, Utku Umur; Çaşkurlu, Buğra; Yücel, Edaİçinde bulunduğumuz Büyük Veri çağında birçok firma devasa boyutlarda verilerle çalışmaktadır. Veritabanı göçü, büyük veri üstüne çalışan firmalar için önemli bir problemdir. Veritabanı göçünün, servis kalitesi gereksinimleri nedeniyle tek seferde gerçekleştirilmesi çoğu zaman mümkün değildir. Bu yüzden, firmalar veritabanı göçünü parti adı verilen birden çok kısa zaman aralığında gerçekleştirmeyi tercih etmektedirler. Veritabanı göçü maliyetli bir işlem olmasının yanı sıra ciddi güvenlik riskleri de içermektedir. Bu nedenle, veri göçü işleminde, bazı firmalar uygulama testlerinden kaynaklanan maliyeti düşürmeyi amaçlarken, göç ettirilecek verinin gizli veya hassas bilgiler içerdiği durumlarda firmalar güvenlik risklerini azaltmayı amaçlamaktadırlar. Literatürde veritabanı göçü planlaması problemi uygulama test maliyetinin azaltılması yönünden ele alınmıştır. Bu çalışma ise uygulama test maliyetine ortogonal bir metrik olan güvenlik riskinin azaltılmasına odaklanmaktadır. Veri ne kadar uzun süre erişme açık kalırsa, o kadar büyük bir güvenlik ihlal riski oluşturmaktadır. Dolayısıyla bu tezde ele alınan veritabanı göçü planlaması probleminde güvenlik riski göçün tamamlanması gereken parti sayısıyla ilişkilendirilmektedir. Buna bağlı olarak, güvenlik riskinin minimize edilmesi için veri göçü en az sayıda parti kullanılarak tamamlanmalıdır. Bu çalışmada veritabanı göçü planlaması probleminin güvenlik riskinin minimize edilmesi yönünden ele alınması için teorik bir problem çatısı tanımlanmaktadır. Bu çatı firmaların farklı ihtiyaçları göz önünde bulundurularak tasarlanmıştır ve toplamda 24 farklı modelden oluşmaktadır. Tanımlanan çatıdaki 24 problem modelinden 23 tanesinin hesaplama karmaşıklığı tespit edilmiştir. Bu modellerin 16 tanesinin NP-zor olduğu, 7 tanesinin ise polinom zamanda çözülebildiği tespit edilmiştir. Ayrıca NP-zor modellerden 2 tanesinin asimptotik tamamen polinom zamanlı yakınsama şemasına sahip olduğu, 12 tanesinin ise polinom zamanlı yakınsama şemasına sahip olmadığı ispatlanmıştır. NP-zor modeller için kurucu sezgisel algoritmalar, yerel arama algoritmaları ve bunları kullanan memetik algoritmalar geliştirilmektedir. Geliştirilen memetik algoritmalar problem spesifik 2 çaprazlama ve 2 mutasyon operatörü kullanmaktadır. Geliştirilen memetik algoritmalar 8 saniyeden az bir sürede, örneklerin %95'inde optimalden en fazla %10 uzaklıkta çözümler bulmakta ve örneklerin 72,1'ini optimal çözmektedir. Ayrıca, memetik algoritmalar 82 saniyeden kısa bir sürede, örneklerin %95'inde optimalden en fazla %7 uzaklıkta çözümler bulmakta ve örneklerin 74,5'ini optimal çözmektedir.Master Thesis Dram Üzerinde Gerçek Rastgele Sayi Üretme Mekanizmalari için Sistem Tasarimi(TOBB ETÜ, 2022) Bostancı, Fatma Nisa; Ergin, OğuzRastgele sayı üretimi kriptografik algoritmalar, bilimsel simülasyonlar ve endüstriyel araçlar gibi birçok uygulama için önemlidir. Gerçek Rastgele Sayı Üreteçleri (GRSÜler) fiziksel entropi kaynaklarını örnekleyerek kriptografik olarak güvenli rastgele sayılar üretmektedir. GRSÜler bu nedenle genellikle fazladan donanıma ihtiyaç duymaktadır ve uzun gecikme sürelerine sahiptir. GRSÜler üzerine yapılan çalışmalarda, yüksek hızla ve düşük gecikmeyle gerçek rastgele sayı üretimini yaygın kullanılan cihazlarda gerçekleştirebilmek için DRAM aygıtlarını entropi kaynağı olarak kullanan mekanizmalar önerilmiştir. Bu çalışmalar, DRAM aygıtları örneklenerek rastgele sayı üretilebileceğini göstermektedir fakat önerilen mekanizmaların gerçek sistemlerde kullanılabilmesi için gereken uçtan uca sistem entegrasyonu birçok zorluğa sahiptir. DRAM tabanlı GRSÜlerin güncel sistemlerde kullanılabilmesi için aşılması gereken üç temel zorluk tespit etmekteyiz: (1) DRAM tabanlı GRSÜler ile rastgele sayı üretimi, bellek denetleyicisinde asıl bellek istekleri ile rastgele sayı üretimi (RSÜ) istekleri arasında bir çatışma (RSÜ çatışması) oluşturarak tüm sistemin başarımını düşürebilmektedir, (2) bu çatışma yoğun bir biçimde rastgele sayı kullanan uygulamaların (GRSÜ uygulamalarının) önceliklendirilmesine sebep olarak sistem adilliğini düşürebilmektedir ve (3) DRAM tabanlı GRSÜlerin gecikmeleri nedeniyle GRSÜ uygulamalarında ciddi başarım kayıpları gözlemlenebilmektedir. Bu zorlukları aşmak için DR-STRaNGE 'i geliştirmekteyiz. DR-STRaNGE, (1) RSÜ istekleri ile bellek isteklerini bellek denetleyicisinde ayırarak RSÜ çatışmasını azaltan, (2) RSÜ isteklerinin farkında olan bir GRSÜ bellek istek planlayıcı ile sistem adilliğini artıran ve (3) DRAM kanallarında atıl çevrimleri öngören bir mekanizma kullanılarak doldurulan bir rastgele sayı arabelleği ile yüksek GRSÜ gecikmelerini saklayan bir sistem tasarımıdır. DR-STRaNGE 'i, 186 farklı çoklu programlanmış iş yükü kullanarak değerlendirmekteyiz. Deneysel değerlendirmelerimiz sonucunda, DRAM aygıtlarında rastgele sayı üretimini yoksayan sistemlere kıyasla uçtan uca sistem tasarımımızın, GRSÜ ve GRSÜ olmayan uygulamalarda ortalama sistem performansını sırasıyla %25.1 ve %17.9 artırdığını ve 5 Gb/s hızla gerçek rastgele sayı üretirken ortalama sistem adilliğini %32.1 artırdığını göstermekteyiz. DR-STRaNGE'in GRSÜ ve GRSÜ olmayan bellek işlemlerinde harcanan süreyi %15.8 azalttığı için DRAM aygıtlarında rastgele sayı üretimini yoksayan sistemlere kıyasla enerji tüketimini %21 azalttığını göstermekteyiz.Master Thesis Düsük-gerilimli Sram Aygitlari için Gerçek Rastgele Sayi Üretme ve Hata Modelleme Yöntemleri(TOBB ETÜ, 2022) Yüksel, İsmail Emir; Ergin, OğuzTezin ilk çalışması olarak, SRAM'ler üzerinde deneysel düşük gerilim çalışmalarından çıkarılan gerçek hataları kullanarak ilk yaklaşık düşük gerilim hata modelini oluşturan bir altyapı olan MoRS'yi öneriyoruz. SRAM tabanlı bellekler, heterojen cihazlar, örneğin, GPU'lar, FPGA'lar, ASIC'ler dahil olmak üzere çeşitli bilgi işlem cihazları için yüksek performans elde etmek için çok önemli bileşenlerdir. Bu heterojen yapılar üzerinde çalışan Derin Sinir Ağları (DSA) gibi modern iş yükleri, verimli hızlandırma için büyük ölçüde yonga üzerindeki bellek mimarisine bağlıdır. Enerji tasarrufu sağlamanın yaygın yöntemlerinden biri, besleme voltajının nominal seviyenin altına düşürülmesidir. Bu tür sistemler, belirli bir voltaj sınırına kadar arızaya neden olmadan güvenli bir şekilde voltajı düşürülebilir. Bu güvenli aralığa voltaj koruma bandı da denir. Bununla birlikte, sistemin frekansı düşürmeden koruma bandı seviyesinin altındaki voltaja düşürmek, zamanlamaya dayalı hatalara neden olur. Sistemin dayanıklılığını değerlendirmek için MoRS tarafından üretilen hataları DSA hızlandırıcısının yonga üzerindeki belleğine enjekte ediyoruz. MoRS, tamamen rastgele oluşturulmuş bir hata enjeksiyon yaklaşımına kıyasla gerçek deney hatalarına daha yakın olurken, yüksek zamanlı ek yük deneylerine ihtiyaç duymadan basitlik avantajına sahiptir. DSA'nın ağırlık değişkenlerini SRAM'lere eşleyerek popüler DSA iş yüklerinde yaptığımız deneyi değerlendirip MoRS ile gerçek veriler arasındaki sınıflandırma yüzdesinin farkını ölçeriz. Sonuçlarımız, gerçek deneyler ile MoRS'un çıktısı arasındaki maksimum farkın %6,21, gerçek deneyler ile rastgele hata enjeksiyon modeli arasındaki maksimum farkın ise %23.2 olduğunu göstermektedir. Gerçek verilere sınıflandırma yüzdesi açısından, MoRS'nin çıktısı, rastgele hata enjeksiyonu yaklaşımından 3.21x daha iyi performans gösterir. Tezin ikinci çalışması olarak SRAM tabanlı belleklerde düşük voltajdan kaynaklanan hataları kullanan SRAM tabanlı gerçek rastgele sayı üreteci öneriyoruz. Gerçek rastgele sayı üreteçleri (GRSÜ), elektriksel gürültü, termal gürültü ve saat titreşimleri gibi öngörülemeyen fiziksel entropi kaynaklarından üretilmektedir. Ancak, tüm bilgi işlem cihazları bu kaynaklardan entropi çıkarmak için özel donanıma sahip değildir. Bu nedenle, özel donanım aracılığıyla bilgi işlem sistemlerine gerçek rasgele sayı üretme yeteneği sağlamak maliyetlidir. Önceki çalışmalar, çoğu hesaplama sistemlerinde mevcut olan bellek aygıtlarından entropi çıkaran GRSÜ'ler önermektedir. SRAM tabanlı GRSÜ'lerin diğer bellek tabanlı mekanizmalara göre iki büyük avantajı vardır: (i) SRAM aygıtları, tüm çağdaş CMOS tabanlı yongalarda kullanıldığı için her ölçekte bilgi işlem sistemine rasgele sayılar sağlayabilir ve (ii) SRAM bir yonga üstü bellek olduğundan kimse rastgele sayı aktarımlarını dışarıdan gözetleyemez ve bu sayede gerçek rastgele sayıların güvenliğini artırır. SRAM tabanlı GRSÜ'ler bu avantajlar nedeniyle umut verici olsa da, mevcut SRAM tabanlı GRSÜ'ler iki temel sınırlamadan muzdariptir: 1) sık sık güç döngüsüne ihtiyaç duyar, bu da aşırı derecede büyük gecikmelere ile düşük verime neden olur ve 2) önemli bir enerji yüküne sahiptir. Amacımız, bu iki temel sınırlamanın üstesinden gelen SRAM tabanlı bir GRSÜ tasarlamaktır. Bu amaçla, yeni bir yüksek aktarım hızlı, enerji verimli ve düşük gecikmeli SRAM tabanlı GRSÜ olan TuRaN'ı öneriyoruz. TuRaN, SRAM besleme voltajının üretici tarafından önerilen eşiğin altına düştüğünde SRAM hücrelerinin okunmasının rastgele değerlerle sonuçlandığı temel gözleminden yararlanır. TuRaN, düşük voltajlı SRAM'a tekrar tekrar erişerek yüksek hızda gerçek rastgele sayılar üretir hücreleri ve ardından SHA-256 karma işlevini kullanarak ortaya çıkan hataları işleyerek gerçek rastgele sayı üretir. TuRaN'ın gerçek rastgele sayılar ürettiğini göstermek için, iki ticari kullanıma hazır FPGA kartı üzerinde gerçek deneyler yapıyoruz. Yaygın olarak benimsenen NIST STS'yi kullanarak TuRaN tarafından üretilen rastgele sayıların kalitesini değerlendiriyoruz ve TuRaN'ın tüm testleri geçtiğini gözlemliyoruz. TuRaN, (i) 1,6 Gbps (1,812 Gbps) ortalama (maksimum) aktarım hızı, (ii) 0,11nJ/bit enerji tüketimi ve (iii) 278,46us gecikme süresi ile gerçek rastgele sayılar üretir. TuRaN, en son teknoloji ürünü SRAM tabanlı GRSÜ'lerden sırasıyla 2,26x, 5,09x ve 5,39x aktarım hızı, enerji verimliliği ve gecikme süresi ile daha iyi performans göstermektedir.Master Thesis Avrupa Birligi Kamu Alimi İhaleleri İlan Metinlerinin Ekonomik Etkilerinin Dogal Dil İsleme ile İncelenmesi(TOBB ETÜ, 2022) Görgün, Mustafa Kaan; Kutlu, Mücahid; Taş, Bedri Kamil OnurKüresel bazda kamu alımları 11 trilyon dolar tutarı ile muazzam bir ekonomik aktiviteye denk gelmektedir. 250 binden fazla Avrupa Birliği kamu otoritesi her yıl Avrupa Birliği'nin (AB) gayri safi yurtiçi hasılasının (GSYİH) yüzde 14'ünü oluşturan yaklaşık 2.3 trilyon euroyu kamu alımları için harcamaktadır. Yapılacak küçük çaplı iyileştirmeler bile kamu kaynaklarının kullanımını büyük ölçüde etkilemektedir. Bu nedenle kamu kaynaklarının etkin kullanımı için rekabetçi ve maliyet etkin kamu alım süreçlerinin oluşturulması önem arz etmektedir. Kamu otoriteleri ise piyasa rekabet gücünün sağlanması, verilerin şeffaflığı ve güvenilirliği gibi Avrupa Birliği Komisyonunun direktiflerininin uygulamasından sorumludur. Kamu alımları faaliyetlerini kontrol edebilmek için ilan edilmeden önceki süreçte ihale ölçütlerini tahmin edebilmek önem arz etmektedir. Binlerce belge içerisinden ihale ölçütlerinin belirlenmesi başlı başına önemli bir problem olarak karşımıza çıkmaktadır. Bu çalışmada kullanılan veri kümesi, 2011'den 2018'e kadar 22 AB üye ülke dilini kapsayan AB'nin Resmi Gazetesine Ekinin çevrimiçi versiyonu olan Tenders Electronic Daily'deki (TED) kamuya açık sözleşme belgelerindeki sözleşme açıklama metinlerinden derlenmiştir. Gerçek veriler kullanılarak yapılan deneylerde, çok dilli hassas ayarlanan dönüştürücü modeller, cümle temsil vektörleri tabanlı yaklaşımlar ve öznitelik tabanlı yaklaşımlar önerilen metotlar olarak sunulmaktadır. Önerilen metotlar yalnızca ilan açıklamalarını kullanarak tek teklifli sözleşmeler, toplam teklif sayısı, yabancı firma sözleşmeleri ve sözleşme fiyatının etkinliği olmak üzere dört ekonomik ölçütü tahmin etmek için kullanılmaktadır. Önerilen yöntemler, tüm tahmin görevlerinde kelime frekans vektörlerini ve ekonomik göstergeleri kullanan modeller de dahil olmak üzere tüm temel modellerden daha iyi performans göstererek, ilan açıklamalarının kamu ihalelerinin sonuçlarında önemli bir rol oynadığını göstermektedir. Ayrıca, çok dilli eğitimin tüm görevlerde orjinal dildeki eğitime göre tahmin performansını geliştirdiği görülmektedir. Bu ise kullanılan veri kümesinin diğer ülkelerin kamu ihale ilanları için de kullanılabileceğini göstermektedir. Geliştirilen modeller, kamu ihale yetkilileri tarafından ihale ilanlarının inceleme sürecini otomatikleştirmek ve düşük rekabete neden olanları tespit etmek için kullanılabilir. Ayrıca katılımcı firmalar karşılaşacakları potansiyel rekabeti tahmin etmek için geliştirilen modelleri kullanarak daha öngörülebilir kararlar alabilir ve geleceğe yönelik risklerini azaltabilirler. Aynı zamanda belirtilmelidir ki geliştirilen modeller sadece kamu alımı ilan metinlerindeki açıklamaları kullanmaktadır. Bu nedenle model performansları ihale süreçlerini etkileyen diğer ekonomik etkenler dahil edilerek iyileştirmeye açık olmakla birlikte bu çalışmanın kapsamının dışında kalmaktadır.Master Thesis Dogru ve Yanlis Al Sat Önerilerinin Finansal Teknik İndikatörler ile Ayirt Edilmesi(TOBB ETÜ, 2023) Tüfekci, Zeynep; Abul, OsmanBu çalışmanın amacı, Doğru ve Yanlış Al / Sat önerilerini ayırt etmek için makine öğrenme yöntemi ile bir karar destek sistemi geliştirmektir. 30/70 Göreceli Güç İndeksi şeması gibi çeşitli öneri şemaları birçok yatırımcı tarafından etkin bir şekilde kullanılmaktadır. Bununla birlikte, bu öneri şemalarından üretilen sinyaller art arda ve çok sık olması dolayısıyla çoğu zaman şüpheli bulunmakta ve bu nedenle eyleme geçilememektedir. Bu çalışmada, fiyat verilerinden faydalanarak optimal bir yatırım modeli çıkarmak için dinamik programlama formülasyonu geliştirilmektedir. Bu optimal yatırım modeli, çeşitli finansal göstergelerle daha sonra çevrimiçi olarak başvurulabilecek ikili sınıflandırma modelini elde etmek için kullanılmaktadır. Dolayısıyla, önerilen sistem yatırımcılara birincil tavsiye veren indikatörlerden kalan belirsizliklerin ortadan kaldırılmasına yardımcı olur. Dinamik programlama formülasyonu, doğrusal zamanda verimli bir şekilde çalışmaktadır. Dinamik Programlama, birincil önericinin AL-SAT önerilerinin içinden daha iyi olanlarının belirlenip, etiketlenmesi aşamasında kullanılmıştır. Bu yaklaşım, deneysel olarak BIST-100, DOW-30 hisse senetleri ve döviz kurları üzerinde değerlendirilmiştir. Tahmin özellikleri olarak kullanılan teknik göstergeler; Göreceli Güç İndeksi, Trend Normalize edilmiş Göreceli Güç İndeksi, Yüzde Fiyat Osilatörü, Bollinger Bant Yüzdesi, Stokastik Osilatör, Fiyat Değişim Oranı ve Emtia Kanal İndeksi'dir. Bu çalışmada, Destek Vektör Makineleri, ikili sınıflandırma modeli olarak kullanılmaktadır. Bir günün sonunda oluşan göstergeleri öznitelik olarak kullanmanın yanı sıra, ardışık iki günün teknik göstergeleri öznitelik olarak kullanılarak daha başarılı sonuc elde edilmiştir. Bu çok zor ikili sınıflandırma görevinde tek günün verileri ile %70 üzerinde, ardışık iki günün verileri ile %73un üzerinde doğruluk elde edilmiştir.Master Thesis Çizge Sinir Aglari ve Derin Takviyeli Ögrenme Kullanarak Otomatik Molekül Üretimi(TOBB ETÜ, 2022) Işık, Rıza; Tan, MehmetBelirli istenen özelliklere sahip moleküler yapılar inşa etme fikri, ilaç keşfi ve malzeme bilimindeki birkaç büyük problemin temelini oluşturur. Fakat, kimyasal uzay o kadar geniştir ki, günümüzde mevcut olan hesaplama kaynakları ile bu alanın tamamını araştırmak imkansızdır. Bu nedenle, yeni bir ilaç bulmak hem zaman hem de maddi açıdan çok maliyetli olabilir. Neyse ki, son yıllarda artan veri ile birlikte bilgisayar donanımı ve yazılımındaki gelişmeler, doğal dil işlemeden bilgisayarla görüye uzanan alanları etkileyen derin yapay sinir ağlarında bir devrime yol açmıştır. Derin öğrenme, moleküler özelliklerin tahmini ve optimizasyonu için yeni yolların tasarımı da dahil olmak üzere, ilaç keşfindeki bir dizi alanı etkilemiştir. Derin öğrenmedeki bu gelişmeler ve ilaç üretimi için kullanılabilecek büyük veri tabanlarının artışı sayesinde son yıllarda umut verici sonuçlar alınmıştır. Bu tez çalışmasında, istenen belirli özellikler için yeni moleküller üretebilen bir model geliştirilmiştir. Bu model temelde iki farklı modelin birleşiminden oluşmaktadır. İlk model, moleküllerin üretilmesini gerçekleştiren bir Derin Takviyeli Öğrenme mimarisine sahiptir. Diğer model ise Derin Takviyeli Öğrenme mimarisine sahip modelin eğitiminde kullanılan moleküler temsilleri üreten bir Çizge Sinir Ağı'dır. Bu Çizge Sinir Ağı modeli için de iki farklı mimari kullanılmıştır. Bu mimarilerden ilki, Çizge Evrişimsel Ağı, diğeri ise Çizge Dikkat Ağı'dır. Geliştirilen modeli kullanarak temelde beş ayrı iş için molekül optimizasyonu ve üretimi gerçekleştirilmiştir. Bu işler, QED değerinin optimizasyonu, benzerlik kısıtlaması ile cezalı LogP değerinin optimizasyonu, benzerlik kısıtlaması ile QED değerinin optimizasyonu, belirlenen hedef protein alıcıları (F2, PPAR, JAK2) için kenetlenme skorunun optimize edilmesi ve kenetlenme skorunun optimize edildiği işteki eğitilen model kullanılarak rastgele başlangıç moleküllerinin optimize edilmesi şeklindedir. Önerilen bu modeli kıyaslamak için literatürde benzer görevlerde en iyi sonuçları almış bir model olan MolDQN, temel yöntem olarak tercih edilmiştir. Kıyaslamak için kullanılan bu model aynı Derin Takviyeli Öğrenme mimarisine sahiptir ancak eğitilirken molekül temsili olarak Morgan Parmak İzi'ni kullanmaktadır. Yapılan deneylerin sonuçları, Çizge Sinir Ağı mimarisini kullanarak üretilen moleküllerin, Morgan Parmak İzi yöntemi kullanılarak üretilen moleküllerden belirgin düzeyde daha başarılı olduğunu göstermiştir.Master Thesis Derin Ögrenme ile Çizge Zaman Serilerinin Analizi(TOBB ETÜ, 2022) Keskin, Mustafa Mert; Özbayoğlu, Ahmet MuratZaman serileri bir nesnenin zamansal değişimini anlamak için kullanılır. Finans, enerji sektörü, trafik gibi çeşitli alanlarda zaman serileri ile karşılaşılmaktadır. Ayrıca anomali tespiti, davranış tanıma gibi birçok problem, zaman serisi problemi olarak modellenebilir. Bu yüzden gerçek hayatta sıkça karşılaşılan zaman serilerinin analizi büyük öneme sahiptir. Dolayısıyla, zaman serisi problemleri yaygın bir şekilde araştırılmakta ve çözülmeye çalışılmaktadır. Çizgeler ise nesneler arası ilişkileri analiz etmek için kullanılır. Bazı zor problemler, problem verisi çizge olarak analiz edildiği zaman daha iyi anlaşılabilir. Bu yüzden çizge problemleri de literatürde önemli bir yer sahiptir. Zaman serileri ve çizgeler problemin farklı yönlerini anlama imkânı sunarlar. Bu yüzden, literatürde zaman serilerini çizgeler ile birleştirerek daha iyi modelleme yapan çalışmalar mevcuttur. Bu yöntem finans alanında bazı çalışmalarda uygulanmaktadır. Bu tez çalışmasında, finansal tahmin problemi için derin öğrenme yöntemleri ile çizge serisi analizi yapılmıştır. Bunun için öncelikle DOW 30 borsası bir çizge olarak temsil edilmiştir. Sonrasında farklı zaman anlarındaki çizgeler sıralanarak çizge serisi oluşturulmuştur. Elde edilen seri ile yapay sinir ağı eğitilerek hisselerin değişim miktarı tahmini yapılmıştır. Tahmin edilen değişim miktarına göre ana paradan günlük al/sat stratejisi uygulanarak yatırım yapılmıştır. Bunun sonucunda yıllık getiri yüzde olarak hesaplanmıştır. Araştırma sonucunda, sadece zaman serisi kullanılarak geliştirilen derin öğrenme modellerine kıyasla daha yüksek ortalama yıllık getiri kazanılmış olup çizge serisi kullanmanın finansal tahmini ciddi ölçüde iyileştirdiği bir başka deyişle zaman serisi ile yakalanamayacak çıkarımların yapılabildiği sonucuna varılmıştır. Tez çalışmasında, birden çok yöntemle çizge serisi oluşturulmuştur. Farklı çizgelerle eğitilen derin öğrenme modelleri ile benzer ortalama yıllık getiri elde edilmiştir. Böylece, çizge serisi elde etme yönteminin güçlü (robust) ve kararlı (stable) bir yöntem olduğu gösterilmiştir. Ayrıca eğitilen derin öğrenme modellerinin çıktılarından en çok artan hisse tahminin yapan bir kolektif model eğitilmiştir. Nihai model ile ortalama yıllık %26,68 kazanç elde edilmiştir. Bu yöntemin literatürdeki temel yöntemlerin yanı sıra çeşitli açgözlü (greedy) algoritmadan da daha yüksek getiri sağladığı gösterilmiştir. Sonuç olarak geliştirilen kolektif model, gerçek hayatta günlük al/sat stratejisi için kullanılabilecek bir yöntem olarak önerilmiştir.Master Thesis Açik Kaynak Saldiri Tespit Sistemlerinin Açik Kural Setleriyle Analizi(TOBB ETÜ, 2022) Gündoğdu, İlayda; Selçuk, Ali Aydınİnternet teknolojilerinin gelişmesiyle birlikte siber saldırılarda da artış gözlenmektedir. Bunun sonucunda siber saldırıları tespit etmek ve önlemek amacıyla çeşitli sistemler geliştirilmiştir. Saldırıları tespit etmek amacıyla en çok kullanılan açık kaynak ve ağ tabanlı saldırı tespit sistemleri Snort ve Suricata iken, en çok kullanılan açık kaynak ve host tabanlı saldırı tespit sistemleri ise OSSEC ve Wazuh'tur. Bu çalışmada, Snort ve Suricata'nın en son versiyonlarının varsayılan konfigürasyonlarla ve açık kural setleri kullanılarak saldırıları tespit etmedeki etkinliği karşılaştırmalı olarak analiz edilirken, OSSEC'in ve Wazuh'un ise host tabanlı saldırı tespit sistemleri olarak tespit etkinliği incelenmiştir. Tespit etkinliğini ölçmek için alarm üretilen atak sayılarının toplam atak sayısına oranı hesaplanmıştır. Çalışmada açık Kural Seti olarak Community Kural Seti, Registered Kural Seti, Talos Kural Seti, Emerging Threats Kural Seti ve Broadcom Kuralları kullanılmıştır. Deneylerde 600 farklı atak trafiği ve 38 farklı zararsız trafik kullanılarak saldırı tespit sistemlerinin tespit etkinliği ve yanlış pozitif alarm oluşturma miktarları analiz edilmiştir. Atak trafiği olarak web uygulama atakları, zararlı yazılım trafikleri ve CVE referanslı zafiyet sömürü trafikleri olmak üzere üç farklı kategoride trafiklere yer verilmiştir. Deneyler sırasında kural setleri tek başına kullanılarak, tüm kural setleri birlikte kullanılarak, zararlı yazılım trafikleri tehdit aktörlerine göre analiz edilerek ve CVE referanslı zafiyet sömürü atakları platformlara ve işletim sistemlerine göre analiz edilerek Snort ve Suricata saldırı tespit sistemlerinin tespit etkinliklerinin ölçülmesi amaçlanmıştır. OSSEC ve Wazuh saldırı tespit sistemlerine ise web uygulama atak trafikleri ve CVE referanslı zafiyet sömürü trafikleri gönderilerek alarm oluşturma durumları analiz edilmiş, ardından başarılı bir atak sonrasında oluşacak alarmlar incelenmiştir. Deneyler sonucunda atak trafiklerinde kural setleri ayrı olarak kullanıldığında en etkin sonuçların Talos Kural Seti ile alındığı, tüm kural setleri birlikte kullanıldığında ise Snort saldırı tespit sisteminin her üç atak türünde de atakları tespit etmede Suricata'dan daha etkin olduğu görülmüştür. Zararsız trafiklerde ise tüm kural setleri tek başına kullanıldığında Talos Kural Seti ve Emerging Threats Kural Seti'nin yanlış pozitif alarm oluşturmadığı ve zararsız trafiklerde tüm kural setleri birlikte kullanıldığında Suricata'nın daha az yanlış pozitif alarm oluşturduğu analiz edilmiştir. OSSEC ve Wazuh Saldırı Tespit Sistemleri'nin ise sızmayla sonuçlanmayan ataklarda alarm vermemekle birlikte, kullanıcıların zararsız komutlarından çok fazla yanlış pozitif alarm oluşturduğu gözlenmiştir.Master Thesis Kentsel Alan Hareketliliginde Anonim Konum Paylasimi(TOBB ETÜ, 2022) Bitirgen, Ozan Berk; Abul, OsmanGPS donanımlı mobil cihazlar günlük hayatın ayrılmaz bir parçası olmaya başladı. Bunun sonucu olarak kullanıcılarına konum tabanlı servis (KTS) sağlayan sosyal ağların sayısı gün geçtikçe artmaktadır. KTS'ler tarafından sunulan ortak bir servis, konum güncelleme servisidir. Konum güncellemeleri coğrafik düzlemdeki gerçek konumu göstermesi sebebiyle, konum tabanlı servis üzerinden yapılan konum güncellemeleri mahremiyet sorunlarını da beraberinde getirmiştir. Bu tezde, insan hareketliliği uygulamaları için kentsel alan hareketliliğinde konum mahremiyeti korumalı konum güncellemesi problemi çalışılmış ve çözümü için veri-merkezli bir çatı önerilmiştir. Tezin ilk bölümünde, kullanıcıların konum mahremiyet profillerine göre ̧sehir ağı üzerinde efektif bir perdelenmiş bölge hesaplama yöntemi geliştirilmiş ve bunu uygulayan bir hareketlilik modeli önerilmiştir. Sonrasında hız tabanlı saldırılar dikkate alınarak ilgili konum mahremiyet modelleri önerilmiş ve konum mahremiyet ihlali yaratan konum güncelleme isteklerini engelleyen algoritmalar geliştirilmiştir. Tezin ikinci bölümünde ise, birlikte bulunma olasılığı olan kullanıcı gruplarına yönelik ortak konumlandırma saldırıları detaylandırılmış ve konum bilgilerinin oluşturabileceği çıkarım kanalları dikkate alınarak ek bir mahremiyet modeli önerilmiş, bu modele göre konum mahremiyetini koruyan algoritmalar geliştirilmiştir. Tez kapsamında konum k-anonimliği, konum mahremiyetini korumak için kullanılmış ve paylaşılan konumun konum mahremiyetini koruması için en az k adet düğüm içermesi olarak düşünülmüştür. Ayrıca, tez çalışması kapsamında simüle verisetleri ve yörüngeler üretilmiş, önerilen hareketlilik modelini ve algoritmaları gerçekleştiren kampsamlı deneysel çalışmalar yapılmış ve sonuçları da sunulmuştur.

